A veces se dice que la regresión cuantil (QR) revela diferentes relaciones entre variables en diferentes cuantiles de la distribución. Por ejemplo, Le Cook et al. "Pensar más allá de la media: una guía práctica para el uso de métodos de regresión cuantil para la investigación en servicios de salud" implica que QR permite que las relaciones entre los resultados de interés y las variables explicativas no sean constantes en los diferentes valores de las variables.
Sin embargo, hasta donde yo sé, en un modelo de regresión lineal estándar con siendo iid e independiente de , el estimador QR para la pendiente
Supongo que la situación es diferente cuando se violan algunos de los supuestos del modelo lineal estándar, por ejemplo, bajo ciertas formas de heterocedasticidad condicional. Entonces, tal vez los estimadores de la pendiente QR convergen en algo más que la pendiente verdadera del modelo lineal y de alguna manera revelan diferentes relaciones en diferentes cuantiles.
¿Qué me estoy equivocando? ¿Cómo debería entender / interpretar adecuadamente la afirmación de que la regresión cuantil revela diferentes relaciones entre variables en diferentes cuantiles?
fuente
Respuestas:
La "pendiente verdadera" en un modelo lineal normal le dice cuánto cambia la respuesta media gracias a un aumento de un punto enX . Al asumir la normalidad y la varianza igual, todos los cuantiles de la distribución condicional de la respuesta se mueven en línea con eso. A veces, estos supuestos son muy poco realistas: la varianza o asimetría de la distribución condicional depende deX y así, sus cuantiles se mueven a su propia velocidad al aumentar X . En QR, verá esto inmediatamente a partir de estimaciones de pendiente muy diferentes. Como OLS solo se preocupa por la media (es decir, el cuantil promedio), no puede modelar cada cuantil por separado. Allí, confía plenamente en el supuesto de la forma fija de la distribución condicional al hacer declaraciones en sus cuantiles.
EDITAR: incrustar comentarios e ilustrar
Si está dispuesto a hacer suposiciones sólidas, no tiene mucho sentido ejecutar QR, ya que siempre puede calcular cuantiles condicionales a través de la media condicional y la varianza fija. Las pendientes "verdaderas" de todos los cuantiles serán iguales a la pendiente verdadera de la media. En una muestra específica, por supuesto, habrá alguna variación aleatoria. O incluso podría detectar que sus suposiciones estrictas estaban equivocadas ...
Permítanme ilustrar con un ejemplo en R. Muestra la línea de mínimos cuadrados (negro) y luego en rojo los cuantiles modelados de datos de 20%, 50% y 80% simulados de acuerdo con la siguiente relación lineal
El código para generar la imagen:
fuente