Trabajo en Economía Política, y muchos de los modelos incluyen variables de control "inocentes" como la población, la desigualdad, el legado colonial, etc. para que el autor pueda reclamar imparcialidad en su variable de interés independiente.
Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contamina esto la imparcialidad de TODAS las variables independientes?
Si eso es cierto, ¿qué podemos hacer? Deje esas variables de control y conducen a un sesgo de variable omitido. Incluya a aquellos en y contaminarán todo en el modelo.
Ejemplo: Un investigador quiere saber si la desigualdad conduce a la violencia, y controla por algunas cosas: Al ver que la desigualdad es endógena ( debido a la variable omitida Nivel de altruismo ), intentará encontrar una variable instrumental para la Desigualdad . Pero, ¿no es probable que el crecimiento y el desarrollo también sean endógenos (es decir, correlacionados con el nivel de altruismo )?
Este ejemplo puede parecer tonto, pero mi punto está en el trabajo de Economía Política / Desarrollo, hay tantos factores en juego (pero omitidos) que me temo que muchas variables incluidas en el LHS son endógenas. Sin embargo, a menudo, el investigador solo busca un instrumento para su variable independiente de mascota únicamente.
fuente
Respuestas:
"Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contamina esto la imparcialidad de TODAS las variables independientes?"
No quiero enfatizar esto demasiado, pero vale la pena mencionar que esto no es cierto en general. Con suerte, la siguiente derivación proporcionará cierta comprensión de la "contaminación" que usted menciona. Como un contraejemplo simple, suponga que el proceso de generación de datos viene dado por donde no se observa. Deje , y . Entonces, está claro que es "endógeno". Pero cuenta que debido a que , nuestra estimación de seguirá estando bien: Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) ≠ 0
"¿Qué podemos hacer?"
Uno de los principales desafíos de hacer una buena econometría es pensar en posibles estrategias de identificación. En el tipo de situación que describe, probablemente no haya nada que pueda hacer sino tratar de abordar el problema de una manera diferente.
fuente
Todo es demasiado fuerte, pero probablemente algo. Este problema se llama "mancha". Eche un vistazo a la prueba en las notas de clase de Greene en la diapositiva 5.
Emily Oster tiene un buen documento de trabajo (y comando Stata
psacalc
) que puede ayudar a unir el sesgo.fuente
En el contexto de la estimación de mínimos cuadrados, la forma en que tenemos que (tratar de) tratar con la posible endogeneidad de los regresores es a través de la estimación de variables instrumentales. Este enfoque no depende de tener solo un regresor endógeno, puede tener muchos. En tal caso, por supuesto, necesita encontrar más instrumentos que dificulten las cosas, pero en principio, el método funcionará de la misma manera.
La estimación IV no resuelve el problema del sesgo, solo proporciona consistencia para el estimador. Pero nada resuelve el problema de la exogeneidad estricta de la barra de sesgo en sí (y luego hay algunos métodos de reducción de sesgo). Pero si echa un vistazo a otro sitio de SE, Cross Validated , que se trata de estadísticas, verá que los estadísticos experimentados realmente no le dan mucha importancia a la propiedad de la imparcialidad: se centran en la eficiencia cuadrática media para las propiedades de muestras finitas, y en consistencia para grandes propiedades de muestra.
fuente
Este es un ejemplo de lo que el estadístico Andrew Gelman llama "la falacia de controlar un resultado intermedio". Aquí está su descripción de esta falacia que aparece cuando los investigadores preguntan si tener más hijas cambia su política. La decisión de tener un segundo hijo está necesariamente condicionada a la decisión anterior de tener el primer hijo y, por lo tanto, parece un claro ejemplo de control para una variable de decisión que era endógena.
¿Tener hijos te hace más conservador? Tal vez tal vez no. Un problema con el control de un resultado intermedio
Con respecto a su comentario de que "Deje esas variables de control y conducen a un sesgo de variables omitido", esto parece depender de qué tipo de instrumento obtiene. Un buen instrumento, uno que realmente satisfaga los requisitos, debe ser independiente del término de error en la segunda etapa y ser independiente de todo lo demás que controle directamente . Es decir, el instrumento cambia Y solo a través de X. Por lo tanto, un instrumento adecuado para la desigualdad debe ser independiente del crecimiento y el desarrollo (¡buena suerte para encontrarlo!) Si creemos que la ecuación de la violencia es la ecuación estructural de la violencia.
fuente
Como han señalado otras publicaciones, los regresores endógenos pueden contaminar todas las estimaciones de parámetros en regresión cuando los regresores están correlacionados.
Además, puede parecer difícil concebir una situación en la que, por ejemplo, y están correlacionados y es endógeno, pero no lo está.X 2 X 2 X 1X1 X2 X2 X1
Sin embargo, se requiere menos que eso para garantizar la consistencia de incluso cuando es endógeno y y están correlacionados.β^1 X2 X1 X2
Considere el siguiente modelo (análogo a la notación de @ jmbejara)
Ahora, si es endógeno pero no tiene el sentido de que toda la correlación entre y desaparecerá después de controlarX2 X1 X1 Z X2 , es decir,
X1X2
fuente