¿Qué sucede si las "variables de control" también son endógenas?

13

Trabajo en Economía Política, y muchos de los modelos incluyen variables de control "inocentes" como la población, la desigualdad, el legado colonial, etc. para que el autor pueda reclamar imparcialidad en su variable de interés independiente.

Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contamina esto la imparcialidad de TODAS las variables independientes?

Si eso es cierto, ¿qué podemos hacer? Deje esas variables de control y conducen a un sesgo de variable omitido. Incluya a aquellos en y contaminarán todo en el modelo.

Ejemplo: Un investigador quiere saber si la desigualdad conduce a la violencia, y controla por algunas cosas: Al ver que la desigualdad es endógena ( debido a la variable omitida Nivel de altruismo ), intentará encontrar una variable instrumental para la Desigualdad . Pero, ¿no es probable que el crecimiento y el desarrollo también sean endógenos (es decir, correlacionados con el nivel de altruismo )?

Violence=Inequality+Growth+Development+ϵ

Este ejemplo puede parecer tonto, pero mi punto está en el trabajo de Economía Política / Desarrollo, hay tantos factores en juego (pero omitidos) que me temo que muchas variables incluidas en el LHS son endógenas. Sin embargo, a menudo, el investigador solo busca un instrumento para su variable independiente de mascota únicamente.

Heisenberg
fuente
Otra cosa a tener en cuenta es el llamado problema de "mal control", una situación en la que el control es una variable de resultado en sí misma. Le sugiero que lea la Sección 3.2.3 en la famosa "Econometría en su mayoría inofensiva" de Angrist y Pischke para comprender este tema y por qué es importante si desea comprender mejor su pregunta.
MauOlivares

Respuestas:

10

"Pero si alguna de estas variables de control es endógena a alguna variable omitida, ¿no contamina esto la imparcialidad de TODAS las variables independientes?"

No quiero enfatizar esto demasiado, pero vale la pena mencionar que esto no es cierto en general. Con suerte, la siguiente derivación proporcionará cierta comprensión de la "contaminación" que usted menciona. Como un contraejemplo simple, suponga que el proceso de generación de datos viene dado por donde no se observa. Deje , y . Entonces, está claro que es "endógeno". Pero cuenta que debido a que , nuestra estimación de seguirá estando bien: Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) 0

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0Cov(X2,Z)0X 2 C o v ( X 1 ,Cov(X1,X2)=0X2β 1 plimCov(X1,Z)=0β1X1 =M2X1M2=[I-X2(X2 X2)-1X2 ]Cov(X1,X2)=0X1 =X1Co
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
donde y . Porque , . Entonces .X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0X1=X1Cov(X1,Z)=0

"¿Qué podemos hacer?"

Uno de los principales desafíos de hacer una buena econometría es pensar en posibles estrategias de identificación. En el tipo de situación que describe, probablemente no haya nada que pueda hacer sino tratar de abordar el problema de una manera diferente.

jmbejara
fuente
Si bien técnicamente tienes razón, no enfatizaría este punto. Prefiero decir que, en general, no podemos descartar el sesgo de ninguna de las variables, en lugar de decir que en algunos escenarios está bien , bueno, porque generalmente no conocemos el DGP.
FooBar
1) ¿Podría señalarme una referencia donde se deriva el esta manera? No me enseñaron esto en mi econometría. 2) ¿Dónde usa en la prueba? Parece que es suficiente. 3) Estoy de acuerdo con @FooBar en que son la excepción, no la norma. De hecho, si no nos molestaríamos en controlar en primer lugar (excepto para aumentar la precisión). CoV(X1,Z)=0CoV(X1,X-2)=0CoV(X1,X2)=0CoV(X1,X2)=0X2β^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0Cov(X1,X2)=0X2
Heisenberg
@FooBar, estoy de acuerdo. He actualizado la publicación para enfatizar que este es un caso especial. En cuanto al punto de no conocer el DGP, eso es cierto. Pero ese no es el punto. Cualquier análisis debe hacer suposiciones sobre el DGP y la calidad del análisis depende de la calidad de las suposiciones. La derivación que di solo sirve para ilustrar un ejemplo de los supuestos (aunque supuestos muy fuertes) que podrían llevarlo a donde desea ir.
jmbejara
@Heisenberg: 1) ¿Podría abrir una nueva pregunta en general sobre esto? Si solo copia y pega la derivación y presenta su pregunta, sería lo mejor. 2) es necesario cuando digo que . 3) tienes razón. Si estamos interesados ​​en predecir , sería importante. Pero sí, ese es un buen punto. Por otro lado, puede ser útil tener en cuenta que el tamaño del sesgo depende de la correlación que creas que son y . C o v ( X 1 , Z ) = 0 Y X 1 X 2Cov(X1,Z)=0Cov(X1,Z)=0YX1X2
jmbejara
1
@jmbejara publiqué 1) como una pregunta separada . Por favor, siéntase libre de editar mi pregunta / título, ya que no sé cómo expresar el título de manera inteligente y útil para Googler en este caso.
Heisenberg
6

Todo es demasiado fuerte, pero probablemente algo. Este problema se llama "mancha". Eche un vistazo a la prueba en las notas de clase de Greene en la diapositiva 5.

Emily Oster tiene un buen documento de trabajo (y comando Stata psacalc) que puede ayudar a unir el sesgo.

Dimitriy V. Masterov
fuente
5

En el contexto de la estimación de mínimos cuadrados, la forma en que tenemos que (tratar de) tratar con la posible endogeneidad de los regresores es a través de la estimación de variables instrumentales. Este enfoque no depende de tener solo un regresor endógeno, puede tener muchos. En tal caso, por supuesto, necesita encontrar más instrumentos que dificulten las cosas, pero en principio, el método funcionará de la misma manera.

La estimación IV no resuelve el problema del sesgo, solo proporciona consistencia para el estimador. Pero nada resuelve el problema de la exogeneidad estricta de la barra de sesgo en sí (y luego hay algunos métodos de reducción de sesgo). Pero si echa un vistazo a otro sitio de SE, Cross Validated , que se trata de estadísticas, verá que los estadísticos experimentados realmente no le dan mucha importancia a la propiedad de la imparcialidad: se centran en la eficiencia cuadrática media para las propiedades de muestras finitas, y en consistencia para grandes propiedades de muestra.

Alecos Papadopoulos
fuente
1
Entonces, el enfoque correcto es encontrar instrumentos para todas las variables endógenas, ¿verdad?
Heisenberg
1
Sí, este es el camino.
Alecos Papadopoulos
5

Este es un ejemplo de lo que el estadístico Andrew Gelman llama "la falacia de controlar un resultado intermedio". Aquí está su descripción de esta falacia que aparece cuando los investigadores preguntan si tener más hijas cambia su política. La decisión de tener un segundo hijo está necesariamente condicionada a la decisión anterior de tener el primer hijo y, por lo tanto, parece un claro ejemplo de control para una variable de decisión que era endógena.

Se han realizado varios estudios en los últimos años que analizan las decisiones económicas de los padres de hijos, en comparación con los padres de hijas ... Una característica común de todos estos estudios es que controlan el número total de hijos ... A primera vista, controlar el número total de niños parece razonable. Sin embargo, hay una dificultad en que el número total de niños es un resultado intermedio, y controlarlo (ya sea subconjustando los datos basados ​​en #kids o usando #kids como una variable de control en un modelo de regresión) puede sesgar la estimación del efecto causal de tener un hijo (o hija).

Para ver esto, suponga (hipotéticamente) que los padres políticamente conservadores tienen más probabilidades de querer hijos, y si tienen dos hijas, tienen (hipotéticamente) más probabilidades de intentar un tercer hijo. En comparación, los liberales tienen más probabilidades de detenerse en dos hijas. En este caso, si observa los datos sobre familias con 2 hijas, los conservadores estarán subrepresentados, y los datos podrían mostrar una correlación de hijas con el liberalismo político, ¡incluso si tener las hijas no tiene ningún efecto! ...

Una solución es aplicar el enfoque conservador estándar (¡en el sentido estadístico!) A la inferencia causal, que consiste en retroceder en la variable de tratamiento (sexo del niño) pero controlando solo las cosas que suceden antes de que nazca el niño. Por ejemplo, uno podría comparar a los padres cuyo primer hijo es una niña con los padres cuyo primer hijo es un niño. También se puede observar el segundo nacimiento, comparando a los padres cuyo segundo hijo es una niña con aquellos cuyo segundo hijo es un niño, controlando el sexo del primer hijo. Y así sucesivamente para el tercer hijo, etc.

¿Tener hijos te hace más conservador? Tal vez tal vez no. Un problema con el control de un resultado intermedio

Con respecto a su comentario de que "Deje esas variables de control y conducen a un sesgo de variables omitido", esto parece depender de qué tipo de instrumento obtiene. Un buen instrumento, uno que realmente satisfaga los requisitos, debe ser independiente del término de error en la segunda etapa y ser independiente de todo lo demás que controle directamente . Es decir, el instrumento cambia Y solo a través de X. Por lo tanto, un instrumento adecuado para la desigualdad debe ser independiente del crecimiento y el desarrollo (¡buena suerte para encontrarlo!) Si creemos que la ecuación de la violencia es la ecuación estructural de la violencia.

BKay
fuente
1

Como han señalado otras publicaciones, los regresores endógenos pueden contaminar todas las estimaciones de parámetros en regresión cuando los regresores están correlacionados.

Además, puede parecer difícil concebir una situación en la que, por ejemplo, y están correlacionados y es endógeno, pero no lo está.X 2 X 2 X 1X1X2X2X1

Sin embargo, se requiere menos que eso para garantizar la consistencia de incluso cuando es endógeno y y están correlacionados.β^1X2X1X2

Considere el siguiente modelo (análogo a la notación de @ jmbejara)

y=X1β1+X2β2+Zγ+ε,

Z no observado, con los supuestos de exogeneidad habituales wrt , es decir, y para todo regresores. es endógeno en el sentido de que para algún par de variables .ε1nx1(k)εp01nx2(k)εp0kX21nx1(k)z(l)p0(k,l)

Ahora, si es endógeno pero no tiene el sentido de que toda la correlación entre y desaparecerá después de controlarX2X1X1ZX2 , es decir,

1nx1(k)QX2z(l)p0
para todos , donde es la proyección sobre el espacio nulo de (el `` residual ''), es decir, entonces estamos bien. La razón se ve en el siguiente estimador de dos pasos de (por ejemplo, Amemiya, 1985, pp. 6-7):(k,l)QX2X2QX2[InX2(X2X2)1X2]β1

X1X2

β^1=(X1QX2X1)1X1QX2y=β1+(X1QX2X1)1X1QX2X2p0β2+(X1QX2X1)1X1QX2Zp0γ+(X1QX2X1)1X1QX2εp0
QED. La tercera línea aquí es clave, y también muestra por qué estamos seguros cuando y no están correlacionados / son ortogonales. Felices regresiones endógenas.X1X2
Murphy
fuente