¿Por qué la suma de los residuos al cuadrado no aumenta al agregar una variable explicativa?

9

En mi libro de texto econométrico (Econometría introductoria) que cubre OLS, el autor escribe: "SSR debe caer cuando se agrega otra variable explicativa". Por que es

Eric Xu
fuente
1
En esencia, porque si no hay una relación lineal con la siguiente variable (correlación parcial de 0 muestras), la SSR permanecerá igual. Si hay alguna relación, la siguiente variable se puede usar para reducir la SSR.
Glen_b -Reinstale a Mónica el
3
El enunciado es correcto en espíritu pero no del todo cierto: SSR se mantendrá igual (y no caerá) al agregar cualquier variable que sea una combinación lineal de las variables existentes. Después de todo, al ignorar la nueva variable, puede lograr el mismo valor mínimo de SSR que logró con la variable anterior, por lo que agregar una nueva variable nunca puede empeorar las cosas.
whuber
Respondí una pregunta similar aquí: stats.stackexchange.com/questions/306267/… . Lo podrías encontrar útil.
Josh

Respuestas:

18

I:yi=β0+β1x1i+ϵi
yoyo:yyo=β0 0+β1X1yo+β2X2yo+ϵyo
SSR1=yo(yyo-β0 0-β1X1yo)2SSR2=yo(yyo-β0 0-β1X1yo-β2X2yo)2β0 0,β1β2=0 0β2

Para resumir, los modelos están anidados, en el sentido de que todo lo que podemos modelar con el modelo 1 puede coincidir con el modelo dos, el modelo dos es más general que el modelo 1. Entonces, en la optimización, tenemos mayor libertad con el modelo dos, por lo que podemos Siempre encuentre una mejor solución.

Esto realmente no tiene nada que ver con las estadísticas, pero es un hecho general sobre la optimización.

kjetil b halvorsen
fuente
1
No he pensado de esta manera, realmente útil!
Eric Xu
1

SSR es una medida de la discrepancia entre los datos y un modelo de estimación.

Si tiene la opción de tener en cuenta otra variable, entonces si esta variable contiene más información, el ajuste sería naturalmente más estricto, lo que significa un SSR más bajo.

Cloud Skywalker
fuente