Predicción de regresión cuantil

13

Estoy interesado en usar la regresión cuantil para algunos de mis modelos, pero me gustaría tener algunas aclaraciones sobre qué puedo lograr con esta metodología. Entiendo que puedo obtener un análisis más robusto de IV / DV relación , especialmente cuando se enfrentan con valores atípicos y heteroscedasticidad, pero en mi caso el foco está en la predicción.

En particular, estoy interesado en mejorar el ajuste de mis modelos, sin recurrir a modelos no lineales más complejos, o incluso regresión lineal por partes. En la predicción, ¿es posible seleccionar el cuantil de resultado de mayor probabilidad basado en el valor de los predictores? En otras palabras, ¿es posible determinar la probabilidad cuantil de cada resultado pronosticado, en función del valor de los predictores?

Robert Kubrick
fuente

Respuestas:

8

El lado derecho de un modelo en regresión cuantil tiene la misma estructura y tipos de supuestos que otros modelos de regresión como OLS. Las principales diferencias con la regresión de cuantiles son que uno predice directamente cuantiles de la distribución de condicionada a X sin recurrir a manipulaciones distributivos paramétricos (por ejemplo, ··· x ± 1,96 s ), y que no forma distributiva de los residuos se supone otro de asumir que Y Es una variable continua.YXx¯±1.96sY

Frank Harrell
fuente
1
Creo que entiendo cómo funciona el proceso de adaptación. Lo que no entiendo es si hay una manera de mejorar la predicción (selección de parámetros cuantiles) sin saber en qué cuantil será la observación. ¿De alguna manera podemos derivar esto de los valores predictores? Quizás haya algo que se pueda usar en función de la distribución de probabilidad de los predictores frente a las observaciones.
Robert Kubrick
2
Y|X=xYX=x
2
Frank, estoy seguro de que necesito aprender más sobre la regresión cuantil. Antes de sumergirme, me gustaría entender si esta metodología puede ofrecer algún componente probabilístico para la elección del cuantil, basado en los predictores y el modelo ajustado. Para cada conjunto / rango dado de valores de predictores, debe haber una probabilidad de que el resultado real caiga en una determinada región cuantil.
Robert Kubrick
4

La regresión cuantil se trata de predecir cuantiles de la variable dependiente. En la regresión "regular", predecimos la media de la DV. Pero el interés podría estar en otras partes del DV. Por ejemplo, puede que le interese predecir qué bebés recién nacidos serán muy livianos, qué canciones serán excepcionalmente populares o qué clientes comprarán un montón de cosas.

Escribí un artículo al respecto para NESUG el año pasado.

Peter Flom - Restablece a Monica
fuente
2
Tú eliges qué cuantil predecir en función de lo que quieres saber. ¡Ningún programa puede decirte qué pregunta hacer!
Peter Flom - Restablece a Monica
1
Dado el modelo ajustado, ¿no puede calcular la probabilidad de que un valor pronosticado caiga en el cuantil 0.6, en base a los valores predictores?
Robert Kubrick
2
No "en el cuartil .6", pero en el cuantil 0.6 o superior, pero sí. Pero tienes que decidir qué cuantil quieres predecir. En la regresión de OLS, predice la media condicional; en la regresión cuantil predices los cuantiles condicionales
Peter Flom - Restablece a Monica
55
Como Peter indicó, todavía no comprende los comentarios anteriores. La regresión cuantil no tiene nada que ver con las probabilidades computacionales de caer por encima o por debajo de un cierto cuantil (tenga en cuenta que la probabilidad de caer "en" el cuantil 0.6 es cero por definición). Averigua si estás interesado en predecir la mediana u otros cuantiles y luego hazlo. Un cuantil condicional es un número único, no un rango.
Frank Harrell
1
Si entiendo, eliges qué cuantil usar para tus predicciones, pero no hay una manera de elegir qué cuantil es el mejor para la predicción