Aunque esta pregunta ya tiene una respuesta aceptada, creo que aún puedo contribuir a esto. El libro de Koenker (2005) realmente no lo llevará lejos porque los desarrollos en la regresión cuantil IV comenzaron a recuperarse en ese momento.
Las primeras técnicas de regresión cuantil IV incluyen el marco de la cadena causal de Chesher (2003) , que fue desarrollado en el enfoque de desviaciones de promedio ponderado (WAD) por Ma y Koenker (2006) . En este documento, también presentan el enfoque de control de la variante. Lee (2007) utilizó una idea similar y obtuvo un estimador de regresión cuantil IV utilizando funciones de control.
Todos estos estimadores hacen uso de una estructura de error triangular supuesta que es necesaria para la identificación. El problema con esto es que esta estructura triangular no es plausible para los problemas de endogeneidad que surgen debido a la simultaneidad. Por ejemplo, no puede usar estos estimadores para un problema de estimación de oferta-demanda.
El estimador de Abadie, Angrist e Imbens (2002), que Dimitriy V. Masterov mencionó, supone que tiene tanto una variable endógena binaria como un instrumento binario. En general, este es un marco muy restrictivo, pero extiende el enfoque LATE de la regresión lineal IV a las regresiones cuantiles. Esto es bueno porque muchos investigadores, especialmente en economía, están familiarizados con el concepto LATE y la interpretación de los coeficientes resultantes.
El artículo seminal de Chernozhukov y Hansen (2005) realmente dio inicio a esta literatura y estos dos muchachos han trabajado mucho en esta área. El estimador de regresión cuantil IV (IVQR) proporciona un enlace natural al estimador 2SLS en el contexto cuantil. Su estimador se implementa a través de Matlab u Ox, como Dimitriy señaló, pero puede olvidarse de ese documento de Kwak (2010). Este documento nunca llegó al diario de Stata y tampoco su código funciona correctamente. Supongo que abandonó este proyecto.
En cambio, debe considerar el estimador de ecuaciones de estimación suavizadas IVQR (SEE-IVQR) de Kaplan y Sun (2012). Este es un estimador reciente que es una mejora con respecto al estimador IVQR original en términos de velocidad computacional (evita el algoritmo de búsqueda de rejilla engorroso) y el error cuadrático medio. El código de Matlab está disponible aquí .
El artículo de Frölich y Melly (2010) es bueno porque considera la diferencia entre la regresión cuantil condicional e incondicional. El problema con la regresión cuantil en general es que una vez que incluye covariables en su regresión, la interpretación cambia. En OLS siempre puede pasar de la expectativa condicional a la incondicional a través de la ley de expectativas iteradas, pero para los cuantiles esto no está disponible. Este problema fue mostrado por primera vez por Firpo (2007) y Firpo et al. (2009). Utiliza una función de influencia recentrada para marginar los coeficientes de regresión cuantil condicional de modo que puedan interpretarse como los coeficientes MCO habituales. Para su propósito, este estimador no ayudará mucho porque solo permite variables exógenas. Si está interesada, Nicole Fortin pone a disposición el código Stata en su sitio web.
El estimador de regresión cuantil IV incondicional más reciente que conozco es de Powell (2013) . Su estimador de regresión cuantil generalizada (IV) le permite estimar los efectos marginales del tratamiento cuantil en presencia de endogeneidad. En algún lugar del sitio web de RAND también pone a disposición su código Stata, aunque no pude encontrarlo ahora. Desde que lo solicitó: en un documento anterior había implementado este estimador en el contexto de datos del panel (ver Powell, 2012 ). Este estimador es excelente porque, a diferencia de todos los métodos QR de datos de panel anteriores, este estimador no se basa en grandes asintóticos T (que generalmente no tiene, al menos no en datos microeconométricos).
Por último, pero no menos importante, una variante más exótica: el estimador IVQR censurado (CQIV) de Chernozhukov et al. (2011) permite cuidar los datos censurados, como su nombre indica. Es una extensión del documento de Chernozhukov y Hong (2003) que no relaciono porque no es para el contexto IV. Este estimador es computacionalmente pesado, pero si ha censurado los datos y no puede evitarlos, este es el camino a seguir. Amanda Kowalski ha publicado el código Stata en su sitio web o puede descargarlo de RePEc. Este estimador (y, por cierto, también el IVQR y SEE-IVQR) supone que tiene una variable endógena continua. He usado estos estimadores en el contexto de regresiones de ingresos donde la educación era mi variable endógena que tomaba entre 18 y 20 valores, por lo que no era exactamente continua. Pero en los ejercicios de simulación siempre pude demostrar que esto no es un problema. Sin embargo, esto probablemente depende de la aplicación, por lo que si decide usarlo, vuelva a verificarlo.
El nuevo Manual de Regresión Cuantil tiene dos capítulos excelentes sobre estos temas:
fuente