El tratamiento habitual de los libros de texto de ajuste por variables superfluas en OLS establece que el estimador aún no es imparcial, pero puede tener una mayor varianza (ver, por ejemplo, Greene, Econometric Analysis, 7th ed., P. 58).
El otro día me topé con el tratamiento de Judea Pearl de la Paradoja de Simpson y una bonita página web que simula cómo "la inclusión gradual de variables de control en un modelo de regresión cambia el signo de una asociación causal estimada en cada paso". Para mí, esto de alguna manera contradice la afirmación anterior. Siento que esto podría ser un problema muy sutil (aunque increíblemente importante), por lo que cualquier puntero a más literatura sería muy útil. Lo que me sorprende especialmente es que Greene afirma que tiene una prueba para su evaluación.
fuente
Considere un modelo de regresión lineal postulado
Como cuestión de álgebra (y no de supuestos estocásticos), el estimador de MCO en notación matricial es
Por lo tanto, su valor esperado condicional en la matriz del regresor es
Entonces: si la "exogeneidad estricta" de los regresores con respecto al término de error se cumple, o, en otras palabras, si todos los términos de error son independientes de la media de todos los regresores, pasado presente y futuro, (que es el supuesto de referencia en el Clásico Modelo de regresión lineal), es decir, simi( u ∣ X ) = 0 , tendremos
usando también la ley de expectativas iteradas.
Dado todo lo anterior, ¿qué significa "variable superflua"? Supongo que significa "no relacionado" con la variable dependiente. Pero "no relacionado" debería traducirse como "estocásticamente independiente". Pero si es independiente de la variable dependiente, es necesariamente independiente del término de error (y, por lo tanto, también es estrictamente exógeno con respecto a ella), por lo que todo lo anterior se cumple también para cualquier variable superflua, y el estimador OLS es imparcial incluso si, digamos, la variableX2 es "superfluo" y el verdadero modelo no lo contiene.
Así es como los economometristas entienden el problema. Ahora, en un entorno más general, "superfluo" podría significar que decir:X2 es independiente de y condicional a la presencia de X1 (que sospecho que está más cerca de lo que Pearl tiene en mente). Aún así, siempre y cuandoX2 es estrictamente exógeno al término de error, el resultado de imparcialidad se mantiene.
fuente