Literatura sobre regresión cuantil IV

16

En los últimos meses, he leído intensamente sobre la regresión cuantil en preparación para mi tesis de maestría este verano. Específicamente, he leído la mayor parte del libro de 2005 de Roger Koenker sobre el tema. Ahora quiero expandir este conocimiento existente a técnicas de regresión cuantil que permitan variables instrumentales (IV). Este parece ser un campo de investigación activo que está creciendo a un ritmo acelerado.

Quizás alguien me sugiera:

  • artículos u otra literatura sobre regresión cuantil IV
  • Una breve descripción de estas diferentes técnicas estadísticas
  • los pros y los contras de diferentes técnicas

Estoy buscando principalmente literatura para comenzar y tener una buena visión general de lo que hay ahí fuera. Entonces, el primer punto es el importante. ¡Sería bueno tener el segundo y el tercero! También mi interés radica principalmente en los métodos de sección transversal, pero también son bienvenidos los métodos de panel.

Gracias por adelantado.

AlexH
fuente

Respuestas:

24

Aunque esta pregunta ya tiene una respuesta aceptada, creo que aún puedo contribuir a esto. El libro de Koenker (2005) realmente no lo llevará lejos porque los desarrollos en la regresión cuantil IV comenzaron a recuperarse en ese momento.

Las primeras técnicas de regresión cuantil IV incluyen el marco de la cadena causal de Chesher (2003) , que fue desarrollado en el enfoque de desviaciones de promedio ponderado (WAD) por Ma y Koenker (2006) . En este documento, también presentan el enfoque de control de la variante. Lee (2007) utilizó una idea similar y obtuvo un estimador de regresión cuantil IV utilizando funciones de control.
Todos estos estimadores hacen uso de una estructura de error triangular supuesta que es necesaria para la identificación. El problema con esto es que esta estructura triangular no es plausible para los problemas de endogeneidad que surgen debido a la simultaneidad. Por ejemplo, no puede usar estos estimadores para un problema de estimación de oferta-demanda.

El estimador de Abadie, Angrist e Imbens (2002), que Dimitriy V. Masterov mencionó, supone que tiene tanto una variable endógena binaria como un instrumento binario. En general, este es un marco muy restrictivo, pero extiende el enfoque LATE de la regresión lineal IV a las regresiones cuantiles. Esto es bueno porque muchos investigadores, especialmente en economía, están familiarizados con el concepto LATE y la interpretación de los coeficientes resultantes.

El artículo seminal de Chernozhukov y Hansen (2005) realmente dio inicio a esta literatura y estos dos muchachos han trabajado mucho en esta área. El estimador de regresión cuantil IV (IVQR) proporciona un enlace natural al estimador 2SLS en el contexto cuantil. Su estimador se implementa a través de Matlab u Ox, como Dimitriy señaló, pero puede olvidarse de ese documento de Kwak (2010). Este documento nunca llegó al diario de Stata y tampoco su código funciona correctamente. Supongo que abandonó este proyecto.
En cambio, debe considerar el estimador de ecuaciones de estimación suavizadas IVQR (SEE-IVQR) de Kaplan y Sun (2012). Este es un estimador reciente que es una mejora con respecto al estimador IVQR original en términos de velocidad computacional (evita el algoritmo de búsqueda de rejilla engorroso) y el error cuadrático medio. El código de Matlab está disponible aquí .

El artículo de Frölich y Melly (2010) es bueno porque considera la diferencia entre la regresión cuantil condicional e incondicional. El problema con la regresión cuantil en general es que una vez que incluye covariables en su regresión, la interpretación cambia. En OLS siempre puede pasar de la expectativa condicional a la incondicional a través de la ley de expectativas iteradas, pero para los cuantiles esto no está disponible. Este problema fue mostrado por primera vez por Firpo (2007) y Firpo et al. (2009). Utiliza una función de influencia recentrada para marginar los coeficientes de regresión cuantil condicional de modo que puedan interpretarse como los coeficientes MCO habituales. Para su propósito, este estimador no ayudará mucho porque solo permite variables exógenas. Si está interesada, Nicole Fortin pone a disposición el código Stata en su sitio web.

El estimador de regresión cuantil IV incondicional más reciente que conozco es de Powell (2013) . Su estimador de regresión cuantil generalizada (IV) le permite estimar los efectos marginales del tratamiento cuantil en presencia de endogeneidad. En algún lugar del sitio web de RAND también pone a disposición su código Stata, aunque no pude encontrarlo ahora. Desde que lo solicitó: en un documento anterior había implementado este estimador en el contexto de datos del panel (ver Powell, 2012 ). Este estimador es excelente porque, a diferencia de todos los métodos QR de datos de panel anteriores, este estimador no se basa en grandes asintóticos T (que generalmente no tiene, al menos no en datos microeconométricos).

Por último, pero no menos importante, una variante más exótica: el estimador IVQR censurado (CQIV) de Chernozhukov et al. (2011) permite cuidar los datos censurados, como su nombre indica. Es una extensión del documento de Chernozhukov y Hong (2003) que no relaciono porque no es para el contexto IV. Este estimador es computacionalmente pesado, pero si ha censurado los datos y no puede evitarlos, este es el camino a seguir. Amanda Kowalski ha publicado el código Stata en su sitio web o puede descargarlo de RePEc. Este estimador (y, por cierto, también el IVQR y SEE-IVQR) supone que tiene una variable endógena continua. He usado estos estimadores en el contexto de regresiones de ingresos donde la educación era mi variable endógena que tomaba entre 18 y 20 valores, por lo que no era exactamente continua. Pero en los ejercicios de simulación siempre pude demostrar que esto no es un problema. Sin embargo, esto probablemente depende de la aplicación, por lo que si decide usarlo, vuelva a verificarlo.

Andy
fuente
¡Esta es una respuesta excelente!
Dimitriy V. Masterov
2
Breve actualización muy egocéntrica: el mencionado Kaplan y Sun (2012) se publicó en 2017; Los enlaces a las versiones publicadas y aceptadas (acceso abierto) junto con los enlaces a MATLAB y al código R se encuentran en faculty.missouri.edu/~kaplandm Próximamente se publicará un documento / código más general (que permite series de tiempo y datos de panel) (disponible por correo electrónico para ahora) ... en realidad, encontré la muy útil revisión anterior mientras revisaba la introducción.
David M Kaplan