¿Qué es una variable instrumental?

36

Las variables instrumentales son cada vez más comunes en economía aplicada y estadística. Para los no iniciados, ¿podemos tener algunas respuestas no técnicas a las siguientes preguntas:

  1. ¿Qué es una variable instrumental?
  2. ¿Cuándo se querría emplear una variable instrumental?
  3. ¿Cómo se encuentra o elige una variable instrumental?
Graham Cookson
fuente
44
¿No crees que el artículo de Wikipedia al respecto es suficiente?
1
Preguntas como esta requieren una respuesta de tipo wiki / blog. Creo que las preguntas no deberían requerir respuestas tan largas.
No estoy seguro de que lo correcto sea simplemente ignorar esta pregunta y remitir al autor de la pregunta al wiki, especialmente durante la versión beta, donde estamos tratando de construir el contenido del sitio. Quizás el autor de la pregunta debería enviar cada una de estas preguntas individualmente para que puedan abordarse mejor.
russellpierce
3
@mbq: el ejemplo de Wikipedia apenas califica como no técnico. Depende mucho de la jerga y las ecuaciones.
rolando2
1
Se ha vuelto común en la economía en algún momento en la década de 1980. Algunos bioestadísticos también han oído hablar de él y lo aplican en el contexto de los modelos de error de medición, donde los instrumentos se consideran estrictamente como mediciones adicionales disponibles. Califican como instrumentos dentro del contexto econométrico más amplio: están correlacionados con la variable de interés y no están correlacionados con su error de medición.
StasK

Respuestas:

41

[Lo siguiente tal vez parezca un poco técnico debido al uso de ecuaciones, pero se basa principalmente en los gráficos de flechas para proporcionar la intuición que solo requiere una comprensión muy básica de OLS, así que no te repulses.]

Suponga que desea estimar el efecto causal de sobre y i dado por el coeficiente estimado para β , pero por alguna razón existe una correlación entre su variable explicativa y el término de error:xiyiβ

yi=α+βxi+ϵicorr

Esto podría haber sucedido porque olvidamos incluir una variable importante que también se correlaciona con . Este problema se conoce como sesgo de variables omitidas y su β no le dará el efecto causal (ver aquí para más detalles). Este es un caso en el que desea utilizar un instrumento porque solo entonces puede encontrar el verdadero efecto causal.xiβ^

Un instrumento es una nueva variable que no está correlacionada con ϵ i , pero que se correlaciona bien con x i y que solo influye en y i a través de x i , por lo que nuestro instrumento es lo que se llama "exógeno". Es como en este cuadro aquí:ziϵixiyixi

zyoXyoyyoϵyo

Entonces, ¿cómo usamos esta nueva variable?
Tal vez recuerdes la idea de tipo ANOVA detrás de la regresión, donde divides la variación total de una variable dependiente en un componente explicado y un componente no explicado. Por ejemplo, si regresas tu en el instrumento,Xyo

xitotal variation=a+πziexplained variation+ηiunexplained variation

entonces usted sabe que la variación explicada aquí es exógena a nuestra ecuación original porque depende solo de la variable exógena . Entonces, en este sentido, dividimos nuestro x i en una parte que podemos afirmar que es ciertamente exógena (esa es la parte que depende de z i ) y alguna parte inexplicada η i que mantiene toda la variación mala que se correlaciona con ϵ i . Ahora tomamos la parte exógena de esta regresión, la llamamos ^ x i ,zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

y poner esto en nuestra regresión original:

yi=α+βx^i+ϵi

Ahora bien, como x i no se correlaciona más con ε i (recuerda, que "han filtrado" esta parte de x i y lo dejó en η i ), se puede estimar consistentemente nuestra β porque el instrumento nos ha ayudado a romper la correlación entre el explicativo de forma variable y el error. Esta fue una forma de aplicar variables instrumentales. Este método en realidad se llama mínimos cuadrados de 2 etapas, donde nuestra regresión de x i en z i se llama "primera etapa" y la última ecuación aquí se llama "segunda etapa".x^iϵixiηiβxizi

En términos de nuestra imagen original (dejo el para no hacer un lío pero recuerda que está ahí!), En lugar de tomar la ruta directa, pero errónea entre x i a y yo hemos dado un paso intermedio a través de x iϵixiyix^i

x^izixiyi

Gracias a esta ligera desviación de nuestro camino hacia el efecto causal, pudimos estimar consistentemente utilizando el instrumento. El costo de esta desviación es que los modelos de variables instrumentales son generalmente menos precisos, lo que significa que tienden a tener errores estándar más grandes.β

¿Cómo encontramos instrumentos?
Esa no es una pregunta fácil porque necesita hacer un buen caso de por qué su no estaría correlacionado con ϵ i ; esto no se puede probar formalmente porque el verdadero error no se observa. Por lo tanto, el desafío principal es encontrar algo que pueda ser visto como exógeno, como los desastres naturales, los cambios en las políticas o, a veces, incluso puede realizar un experimento aleatorio. Las otras respuestas tenían algunos muy buenos ejemplos para esto, así que no repetiré esta parte.ziϵi

Andy
fuente
10
+1 Finalmente estoy agradecido de leer una respuesta detallada en lugar de una lista de referencias o enlaces.
whuber
1
¡Excelente! Les explico esto a mis alumnos más "mnemónicamente" como: está envenenado / contaminado por factores no observados en ϵ . La regresión de la primera etapa "limpia" / absorbe el veneno de x . Podemos usar la versión "limpia" de x para encontrar el coeficiente causal, β . xϵxxβ
MichaelChirico
¿Existe un argumento intuitivo por el cual la estimación de 2SLS para es consistente? Cuando calculamos x i , estamos "filtrando" por parte de x i que está correlacionada con el error, pero ¿por qué debería ser que la filtración de no cambia x i de una manera que cambia nuestra estimación de β ? βx^ixixiβ
user35734
Consulte aquí: stats.stackexchange.com/questions/64279/… o puede hacer una nueva pregunta. Espero que esto ayude.
Andy
@ user35734 no es consistente pero asintóticamente consistente.
Vim
17

Como estadístico médico sin conocimientos previos de economía (etr) ics, luché para comprender las variables instrumentales, ya que a menudo me costaba seguir sus ejemplos y no entendía su terminología bastante diferente (por ejemplo, 'endogeneidad', 'forma reducida ',' ecuación estructural ',' variables omitidas '). Aquí hay algunas referencias que encontré útiles (la primera debería estar disponible gratuitamente, pero me temo que las otras probablemente requieran una suscripción):

También recomendaría el capítulo 4 de:

una parada
fuente
7

No técnico (por lo general, eso es todo para lo que soy bueno): hay momentos en que X no solo causa Y, sino que Y también causa X. Una variable instrumental es un dispositivo que puede "limpiar" esta relación desordenada e inconveniente para que se puedan hacer las mejores estimaciones del efecto de X sobre Y.

La variable instrumental se elige en virtud de sus relaciones: es una causa de X, pero, aparte de actuar a través de X, no tiene ningún efecto sobre Y. El instrumento (o instrumentos) se usa en la Etapa Uno para calcular una nueva "versión". "de X, uno que de ninguna manera es una función de Y. Esta nueva X" predicha "se usa en una segunda etapa, en una regresión más estándar, para explicar / predecir Y. De ahí el término Regresión de mínimos cuadrados de dos etapas .

Normalmente, se encuentra la IV en procesos que anulan o están fuera del control de X o Y, como variables que dependen de leyes, políticas, actos de la naturaleza, etc.

rolando2
fuente