¿Cuál es la diferencia entre regresión cuantil condicional e incondicional?

38

El estimador de regresión cuantil condicional de Koenker y Basset (1978) para el cuantil se define como donde \ rho_ \ tau = u_i \ cdot (\ tau - 1 (u_i <0)) es una función de re-ponderación (llamada función de "verificación") de los residuos u_i .τth

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

En un artículo de Firpo et al. (2009) , los autores afirman que la regresión cuantil condicional no da efectos interesantes. Dicen que los resultados condicionales no pueden generalizarse a la población (en MCO siempre podemos pasar de condicionales a incondicionales a través de la ley de expectativas iteradas, pero esto no está disponible para cuantiles). Esto se debe a que el τth cuantil incondicional yi podría no ser el mismo que el τth cuantil condicional yi|Xi .

Si entiendo correctamente, parte del problema es que qué covariables están incluidas en Xi tiene un efecto en la variable de clasificación ui porque la inclusión de covariables divide el error en componentes observados y no observados. Simplemente no puedo entender por qué esto causa problemas.

Aquí están mis preguntas:

  1. ¿Qué hace que los efectos cuantiles condicionales e incondicionales sean diferentes entre sí?
  2. ¿Cómo puedo interpretar los coeficientes de las regresiones cuantiles condicionales?
  3. ¿Están sesgadas las regresiones cuantiles condicionales?

Referencias

  • Koenker, R. y Bassett, G. (1978) "Cuantiles de regresión", Econometrica , vol. 46 (1), págs. 33-50.
  • Firpo, S. y col. (2009) "Regiones cuantiles incondicionales", Econometrica , vol. 77 (3), págs. 953-973.
AlexH
fuente
1
Le recomendaría que consulte el capítulo 7 de "Econometría mayormente inofensiva" de Angrist y Pischke. Tiene algunos ejemplos de interpretación del coeficiente de regresión cuantil y de las implicaciones de los cuantiles condicionales a X. Estoy de acuerdo con usted en que esas implicaciones no son invalidantes para usar el modelo a menos que esté buscando aislar el impacto de una covariable. Creo que las regresiones cuantiles también pueden estar sesgadas; Angrist y Pischke exploran algunos métodos propuestos para controlar las variables omitidas, por ejemplo.
Juan C
1
No es una respuesta, pero tal vez una pista: la regresión cuantil puede ser considerada como un problema de "datos faltantes", donde los datos faltantes son los pesos utilizados en la regresión OLS ponderada. Por ejemplo, el uso de la distribución exponencial para el peso inverso le proporciona una mediana de regresión ( ). τ=50
probabilityislogic

Respuestas:

29

Configuración
Suponga que tiene una regresión simple de la forma donde el resultado son las ganancias de registro de la persona , es el número de años de escolaridad, y es un término de error. En lugar de solo observar el efecto promedio de la educación sobre las ganancias, que obtendría a través de OLS, también desea ver el efecto en diferentes partes de la distribución de resultados.

lnyi=α+βSi+ϵi
iSiϵi

1) ¿Cuál es la diferencia entre la configuración condicional e incondicional?
Primero, trace los ingresos del registro y permítanos elegir dos individuos, y , donde está en la parte inferior de la distribución de ganancias incondicionales y está en la parte superior. ABABingrese la descripción de la imagen aquí

No parece extremadamente normal, pero eso es porque solo usé 200 observaciones en la simulación, así que no te preocupes por eso. Ahora, ¿qué pasa si condicionamos nuestras ganancias en años de educación? Para cada nivel de educación obtendría una distribución de ingresos "condicional", es decir, obtendría una gráfica de densidad como la anterior pero para cada nivel de educación por separado.

ingrese la descripción de la imagen aquí

Las dos líneas azul oscuro son las ganancias predichas de las regresiones cuantiles lineales en la mediana (línea inferior) y el percentil 90 (línea superior). Las densidades rojas a los 5 años y 15 años de educación le dan una estimación de la distribución de ingresos condicional. Como puede ver, el individuo tiene 5 años de educación y el individuo tiene 15 años de educación. Aparentemente, al individuo está yendo bastante bien entre sus peras en los 5 años de educación, por lo tanto, está en el percentil 90.ABA

Entonces, una vez que condiciona sobre otra variable, ahora ha sucedido que una persona está ahora en la parte superior de la distribución condicional, mientras que esa persona estaría en la parte inferior de la distribución incondicional: esto es lo que cambia la interpretación de los coeficientes de regresión cuantil . ¿Por qué?

Usted ya dijo que con OLS podemos pasar de aplicando la ley de expectativas iteradas, sin embargo, esta es una propiedad del operador de expectativas que no está disponible para cuantiles (¡desafortunadamente!). Por lo tanto, en general , en cualquier cuantil . Esto se puede resolver realizando primero la regresión cuantil condicional y luego integrando las variables de condicionamiento para obtener el efecto marginado (el efecto incondicional) que puede interpretar como en OLS. Powell (2014) proporciona un ejemplo de este enfoque .E[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2) ¿Cómo interpretar los coeficientes de regresión cuantil?
Esta es la parte difícil y no pretendo poseer todo el conocimiento del mundo sobre esto, por lo que tal vez alguien tenga una mejor explicación para esto. Como ha visto, el rango de un individuo en la distribución de ganancias puede ser muy diferente si considera la distribución condicional o incondicional.

Para la regresión cuantil condicional
Dado que no puede saber dónde estará un individuo en la distribución de resultados antes y después de un tratamiento, solo puede hacer declaraciones sobre la distribución en su conjunto. Por ejemplo, en el ejemplo anterior, un significaría que un año adicional de educación aumenta las ganancias en el percentil 90 de la distribución de ganancias condicional (pero no sabe quién todavía está en ese cuantil antes de usted). asignado a las personas un año adicional de educación). Es por eso que las estimaciones cuantiles condicionales o los efectos del tratamiento cuantil condicional a menudo no se consideran "interesantes". Normalmente nos gustaría saber cómo un tratamiento afecta a nuestros individuos, no solo la distribución.β90=0.13

Para la regresión cuantil incondicional
Esos son los coeficientes MCO que estás acostumbrado a interpretar. La dificultad aquí no es la interpretación, sino cómo obtener esos coeficientes, lo que no siempre es fácil (la integración puede no funcionar, por ejemplo, con datos muy escasos). Existen otras formas de marginar los coeficientes de regresión cuantil, como el método de Firpo (2009) que utiliza la función de influencia registrada. El libro de Angrist y Pischke (2009) mencionado en los comentarios afirma que la marginación de los coeficientes de regresión cuantil sigue siendo un campo de investigación activo en econometría, aunque hasta donde sé, la mayoría de las personas hoy en día se conforman con el método de integración (un ejemplo sería Melly y Santangelo (2015) que lo aplican al modelo Cambios en cambios).

3) ¿Están sesgados los coeficientes de regresión cuantil condicional? No (suponiendo que tenga un modelo correctamente especificado), solo miden algo diferente que le puede interesar o no. Un efecto estimado en una distribución en lugar de individuos es, como dije, no muy interesante, la mayoría de las veces. Para dar un ejemplo contrario: considere a un responsable de políticas que introduce un año adicional de escolaridad obligatoria y quieren saber si esto reduce la desigualdad de ingresos en la población.

Los dos paneles superiores muestran un cambio de ubicación puro donde es una constante en todos los cuantiles, es decir, un efecto de tratamiento de cuantiles constante, lo que significa que si , un año adicional de educación aumenta las ganancias en un 8% en toda la distribución de ganancias.βτβ10=β90=0.8

Cuando el efecto del tratamiento cuantil NO es constante (como en los dos paneles inferiores), también tiene un efecto de escala además del efecto de ubicación. En este ejemplo, la parte inferior de la distribución de ingresos aumenta más que la parte superior, por lo que el diferencial 90-10 (una medida estándar de desigualdad de ingresos) disminuye en la población. ingrese la descripción de la imagen aquí

No sabe qué individuos se benefician de él o en qué parte de la distribución están las personas que comenzaron en la parte inferior (para responder ESA pregunta, necesita los coeficientes de regresión cuantil incondicionales). Tal vez esta política los perjudique y los ubique en una parte aún más baja en relación con los demás, pero si el objetivo era saber si un año adicional de educación obligatoria reduce el diferencial de ingresos, entonces esto es informativo. Un ejemplo de este enfoque es Brunello et al. (2009) .

Si todavía está interesado en el sesgo de las regresiones cuantiles debido a las fuentes de endogeneidad, eche un vistazo a Angrist et al (2006), donde derivan una fórmula de sesgo variable omitida para el contexto cuantil.

Andy
fuente
1
¿Existe actualmente una implementación R de esta técnica?
chandler
1

Además de la excelente respuesta proporcionada por @Andy. Es posible que desee ver:

Borah, BJ y Basu, A. (2013). "Destacando las diferencias entre los enfoques de regresión condicional e incondicional a través de una aplicación para evaluar la adherencia a la medicación". Economía de la salud, 22 (9), 1052-1070. http://doi.org/10.1002/hec.2927

JustGettinStarted
fuente