1001Ferramentas
📈Calculadoras

Regressão Linear (Mínimos Quadrados)

Ajusta uma reta y = a·x + b por mínimos quadrados a partir de pares (x, y). Mostra coeficiente angular, linear e R².

Regressão linear simples: ajustando y = a·x + b

A regressão linear simples ajusta uma reta y = a·x + b a um conjunto de pares (x, y) minimizando a soma dos quadrados dos resíduos (mínimos quadrados ordinários, OLS). Solução fechada: a = Σ((xᵢ − x̄)(yᵢ − ȳ)) / Σ(xᵢ − x̄)² e b = ȳ − a·x̄. O coeficiente de determinação R² = 1 − SS_res / SS_tot mede o ajuste numa escala de 0 a 1. O teorema de Gauss-Markov garante que o OLS é o melhor estimador linear não enviesado quando os resíduos são normais, homocedásticos e independentes — os quatro pressupostos clássicos. Método introduzido por Legendre (1805) e analisado rigorosamente por Gauss (1809). Exemplo: pares (1,2), (2,3), (3,5), (4,6), (5,8) dão a ≈ 1,5, b ≈ 0,3, R² ≈ 0,987.

Aplicações

Previsão de vendas a partir do gasto em marketing, machine learning clássico (sklearn.linear_model.LinearRegression), física experimental (lei de Hooke F = k·x estimada ajustando pontos de medição), modelos econométricos (curva de Phillips, estimação de oferta e demanda) e qualquer análise exploratória rápida quando se quer uma relação de base entre duas variáveis.

Perguntas frequentes

O que R² significa exatamente? A fração da variância em y explicada por x. R² = 0,85 indica que a reta explica 85% da variação; os 15% restantes são resíduo.

R² alto implica causalidade? Não. A regressão capta associação, não causa. Correlações espúrias podem dar excelente ajuste sem nenhum vínculo causal.

E se a relação for não linear? O OLS vai subajustar. Aplique uma transformação (log, raiz quadrada), use regressão polinomial ou parta para modelos não lineares como splines e árvores de decisão.

Múltiplos preditores? Estenda para regressão linear múltipla: y = a₁x₁ + a₂x₂ + … + b. A forma matricial β̂ = (XᵀX)⁻¹Xᵀy generaliza a solução fechada.

Ferramentas Relacionadas