Línea de referencia de trama QQ no 45 °

10

Estaba trazando datos de retorno (estandarizados) qqplot()en MATLAB contra los cuantiles teóricos de una distribución normal. Sin embargo, la línea en el QQ-Plot no tiene un ángulo de 45 ° pero se rota un poco.

Tal vez no entiendo el concepto de un gráfico QQ, pero ¿no se supone que es exactamente una línea de 45 °?

Puse la trama para ilustrar el problema.

Gráfico QQ de datos de devolución estandarizados

mscnvrsy
fuente
Es bien sabido que los datos de retorno estandarizados no son normales, entonces, ¿por qué estarían en una línea de 45 grados? Los retornos son más pesados ​​de lo normal y eso es lo que muestran sus datos también.
Glen_b -Reinstalar Monica
Soy consciente de la no normalidad y de que los puntos no deberían estar en la línea misma. Me preguntaba por qué la línea no tiene 45 °.
mscnvrsy
Oh lo siento, eso no estaba claro. He publicado una respuesta.
Glen_b -Reinstalar Monica

Respuestas:

18

¿Debería ser una línea de 45 grados? ¡Depende!

Un gráfico QQ es la curva paramétrica definida por:

X=F-1(pags)y=sol-1(pags)

para pags[0 0,1]. DóndeF-1 y sol-1 son funciones CDF inversas.

Si F=sol entonces X(pags)=y(pags) y estaría en una línea de 45 grados.

Otro caso...

  • Dejar Φ-1(pags) ser el CDF inverso normal estándar.
  • Dejar F-1(pags)=Φ-1(pags)
  • Dejar sol-1(pags)=σΦ-1(pags)+μ

Es decir sol es el CDF inverso para una variable aleatoria normalmente distribuida con media μ y desviación estándar σ mientras Fes el CDF inverso para una variable normal estándar (es decir, media 0, desviación estándar 1). Entonces vemos:

y(pags)=σΦ-1(pags)+μ=σX(pags)+μ

Es decir, la trama es una línea. y=σX+μ

¿Qué está pasando en tu caso?

De la documentación de Matlab paraqqplot

Superpuesta en el gráfico hay una línea que une el primer y el tercer cuartil de cada distribución (este es un ajuste lineal robusto de las estadísticas de orden de las dos muestras). Esta línea se extrapola a los extremos de la muestra para ayudar a evaluar la linealidad de los datos.

Por lo tanto, incluso si estandarizara sus datos, los gráficos de la línea roja de MATLAB no serían una línea de 45 grados si el primer y tercer cuartiles no coincidieran con la distribución normal.

Matthew Gunn
fuente
¡Gracias! ¿Pensé que la línea roja está construida para que puedas ver las desviaciones de los cuantiles normales estándar? Cuando uso datos estandarizados, la línea debería ser y = x entonces, ¿no?
mscnvrsy
@mscnvrsy La línea roja que creo en MATLAB está construida para mostrar lo que debería ser si sus datos siguieran la distribución normal.
Matthew Gunn
¿Hay alguna forma de obtener una línea de 45 ° como línea de referencia? Pensé que esto podría lograrse mediante la estandarización.
mscnvrsy
@mscnvrsy hmmm ... Ahora estoy confundido de dónde viene la línea roja de MATLAB en el QQPlot: P Dame un segundo ... Estoy comprobando el código fuente ...
Matthew Gunn
Para mí, parece más un ajuste de OLS. Pero desafortunadamente uno no puede establecer ningún parámetro relevante en el qqplot().
mscnvrsy
2

La forma en que se determina la línea varía de un paquete a otro, pero una forma común es unir el punto del cuartil inferior (X,y)=(-0,6745,Q1) al punto del cuartil superior (0,6745,Q3).

Mirando la ayuda de Matlab para qqplot, eso es realmente lo que dice que hace Matlab.

La distribución de la muestra tiene un pico y una cola pesada de una manera que hace que sus cuartiles estén más juntos de lo normal para una normal con la misma desviación estándar, lo que hace que la pendiente se acerque más a 0.7 que a 1.

Glen_b -Reinstate a Monica
fuente