Las variables instrumentales son cada vez más comunes en economía aplicada y estadística. Para los no iniciados, ¿podemos tener algunas respuestas no técnicas a las siguientes preguntas:
- ¿Qué es una variable instrumental?
- ¿Cuándo se querría emplear una variable instrumental?
- ¿Cómo se encuentra o elige una variable instrumental?
regression
econometrics
instrumental-variables
Graham Cookson
fuente
fuente
Respuestas:
[Lo siguiente tal vez parezca un poco técnico debido al uso de ecuaciones, pero se basa principalmente en los gráficos de flechas para proporcionar la intuición que solo requiere una comprensión muy básica de OLS, así que no te repulses.]
Suponga que desea estimar el efecto causal de sobre y i dado por el coeficiente estimado para β , pero por alguna razón existe una correlación entre su variable explicativa y el término de error:xi yi β
Esto podría haber sucedido porque olvidamos incluir una variable importante que también se correlaciona con . Este problema se conoce como sesgo de variables omitidas y su β no le dará el efecto causal (ver aquí para más detalles). Este es un caso en el que desea utilizar un instrumento porque solo entonces puede encontrar el verdadero efecto causal.xi βˆ
Un instrumento es una nueva variable que no está correlacionada con ϵ i , pero que se correlaciona bien con x i y que solo influye en y i a través de x i , por lo que nuestro instrumento es lo que se llama "exógeno". Es como en este cuadro aquí:zi ϵi xi yi xi
Entonces, ¿cómo usamos esta nueva variable?Xyo
Tal vez recuerdes la idea de tipo ANOVA detrás de la regresión, donde divides la variación total de una variable dependiente en un componente explicado y un componente no explicado. Por ejemplo, si regresas tu en el instrumento,
entonces usted sabe que la variación explicada aquí es exógena a nuestra ecuación original porque depende solo de la variable exógena . Entonces, en este sentido, dividimos nuestro x i en una parte que podemos afirmar que es ciertamente exógena (esa es la parte que depende de z i ) y alguna parte inexplicada η i que mantiene toda la variación mala que se correlaciona con ϵ i . Ahora tomamos la parte exógena de esta regresión, la llamamos ^ x i ,zi xi zi ηi ϵi xiˆ
y poner esto en nuestra regresión original:
Ahora bien, como x i no se correlaciona más con ε i (recuerda, que "han filtrado" esta parte de x i y lo dejó en η i ), se puede estimar consistentemente nuestra β porque el instrumento nos ha ayudado a romper la correlación entre el explicativo de forma variable y el error. Esta fue una forma de aplicar variables instrumentales. Este método en realidad se llama mínimos cuadrados de 2 etapas, donde nuestra regresión de x i en z i se llama "primera etapa" y la última ecuación aquí se llama "segunda etapa".xˆi ϵi xi ηi β xi zi
En términos de nuestra imagen original (dejo el para no hacer un lío pero recuerda que está ahí!), En lugar de tomar la ruta directa, pero errónea entre x i a y yo hemos dado un paso intermedio a través de x iϵi xi yi xˆi
Gracias a esta ligera desviación de nuestro camino hacia el efecto causal, pudimos estimar consistentemente utilizando el instrumento. El costo de esta desviación es que los modelos de variables instrumentales son generalmente menos precisos, lo que significa que tienden a tener errores estándar más grandes.β
¿Cómo encontramos instrumentos?zi ϵi
Esa no es una pregunta fácil porque necesita hacer un buen caso de por qué su no estaría correlacionado con ϵ i ; esto no se puede probar formalmente porque el verdadero error no se observa. Por lo tanto, el desafío principal es encontrar algo que pueda ser visto como exógeno, como los desastres naturales, los cambios en las políticas o, a veces, incluso puede realizar un experimento aleatorio. Las otras respuestas tenían algunos muy buenos ejemplos para esto, así que no repetiré esta parte.
fuente
Como estadístico médico sin conocimientos previos de economía (etr) ics, luché para comprender las variables instrumentales, ya que a menudo me costaba seguir sus ejemplos y no entendía su terminología bastante diferente (por ejemplo, 'endogeneidad', 'forma reducida ',' ecuación estructural ',' variables omitidas '). Aquí hay algunas referencias que encontré útiles (la primera debería estar disponible gratuitamente, pero me temo que las otras probablemente requieran una suscripción):
Staiger D. Variables instrumentales. Seminario cibernético de AcademyHealth sobre métodos de investigación de servicios de salud, marzo de 2002. http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm
Newhouse JP, McClellan M. Econometría en la investigación de resultados: el uso de variables instrumentales. Revisión anual de salud pública 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17
Groenlandia S. Una introducción a las variables instrumentales para epidemiólogos. Revista Internacional de Epidemiología 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722
Zohoori N, Savitz DA. Enfoques econométricos de los datos epidemiológicos: Relacionar la endogeneidad y la heterogeneidad no observada con la confusión. Annals of Epidemiology 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9
También recomendaría el capítulo 4 de:
fuente
Aquí hay algunas diapositivas que preparé para un curso de econometría en UC Berkeley. Espero que los encuentre útiles --- Creo que responden sus preguntas y proporcionan algunos ejemplos.
También hay tratamientos más avanzados en las páginas del curso para PS 236 y PS 239 (cursos de métodos de ciencias políticas de nivel de posgrado) en mi sitio web: http://gibbons.bio/teaching.html .
Charlie
fuente
No técnico (por lo general, eso es todo para lo que soy bueno): hay momentos en que X no solo causa Y, sino que Y también causa X. Una variable instrumental es un dispositivo que puede "limpiar" esta relación desordenada e inconveniente para que se puedan hacer las mejores estimaciones del efecto de X sobre Y.
La variable instrumental se elige en virtud de sus relaciones: es una causa de X, pero, aparte de actuar a través de X, no tiene ningún efecto sobre Y. El instrumento (o instrumentos) se usa en la Etapa Uno para calcular una nueva "versión". "de X, uno que de ninguna manera es una función de Y. Esta nueva X" predicha "se usa en una segunda etapa, en una regresión más estándar, para explicar / predecir Y. De ahí el término Regresión de mínimos cuadrados de dos etapas .
Normalmente, se encuentra la IV en procesos que anulan o están fuera del control de X o Y, como variables que dependen de leyes, políticas, actos de la naturaleza, etc.
fuente