Espero obtener una explicación intuitiva y accesible de la regresión cuantil.
Digamos que tengo un conjunto de datos simple del resultado , y predictores .X 1 , X 2
Si, por ejemplo, ejecuto una regresión cuantil en .25, .5, .75 y obtengo .
¿Se encuentran los valores simplemente ordenando los valores , y realizando una regresión lineal basada en los ejemplos que están en / cerca del cuantil dado?y
¿O todas las muestras contribuyen a las estimaciones , con pesos descendentes a medida que aumenta la distancia desde el cuantil?
¿O es algo totalmente diferente? Todavía tengo que encontrar una explicación accesible.
quantile-regression
Jeremy
fuente
fuente
Respuestas:
Recomiendo Koenker y Hallock (2001, Journal of Economic Perspectives) y el libro de texto homónimo de Koenker .
Por lo tanto, su intuición es bastante correcta: todas las muestras contribuyen a las estimaciones , con pesos asimétricos que dependen del cuantil que apuntamos.τβ τ
fuente
foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
La idea básica de la regresión cuantil proviene del hecho de que el analista está interesado en la distribución de datos y no solo en la media de los datos. Comencemos con la media.
La regresión media ajusta una línea de la forma de a la media de los datos. En otras palabras, E ( Y | X = x ) = x β . Un enfoque general para estimar esta línea es usar el método de mínimos cuadrados, arg min β ( y - x β ) ′ ( y - X β ) .y= Xβ mi( YEl | X= x ) = x β argminβ( y- x β)′(y-Xβ)
Por otro lado, la regresión mediana busca una línea que espere que la mitad de los datos estén en lados. En este caso, la función objetivo es donde | . El | Es la primera norma.argminβEl | y- XβEl | El | . El |
Extender la idea de mediana a resultados cuantiles en la regresión cuantil. La idea detrás es encontrar una línea en la que el porcentaje de datos esté más allá de eso.α
Aquí cometió un pequeño error, la regresión Q no es como encontrar un cuantil de datos y luego ajustar una línea a ese subconjunto (o incluso los bordes que son más desafiantes).
La regresión Q busca una línea que divida los datos en un grupo q un cuantil y los restos. Función objetivo, diciendo función de comprobación de Q-regresión es β alpha = arg min β { alpha | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
Como puede ver, esta inteligente función objetivo no es más que traducir cuantil a un problema de optimización.
fuente