Bandas de confianza para la línea QQ

14

Esta pregunta no pertenece específicamente R, pero elegí usarla Rpara ilustrarla.

Considere el código para producir bandas de confianza alrededor de una línea qq (normal):

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

Estoy buscando una explicación de (o un enlace alternativo a un documento en papel / en línea que explique) cómo se construyen estas bandas de confianza (he visto una referencia a Fox 2002 en los archivos de ayuda de R, pero lamentablemente no tengo esto libro a mano).

Mi pregunta se hará más precisa con un ejemplo. Así es como se Rcalculan estos elementos de configuración particulares (he acortado / simplificado el código utilizado en car::qqPlot)

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

La pregunta es: ¿cuál es la justificación de la fórmula utilizada para calcular estos SE (por ejemplo, la línea SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) ).

FWIW esta fórmula es muy diferente de la fórmula de las bandas de confianza habituales utilizadas en la regresión lineal

usuario603
fuente
2
Espero que tenga que ver con la distribución de estadísticas de pedidos y más particularmenteel resultado asintótico:X(np)AN(F,p(1
FX(k)(X)=norte!(k-1)!(norte-k)![FX(X)]k-1[1-FX(X)]norte-kFX(X)
X(nortepag)UNnorte(F-1(pag),pag(1-pag)norte[F(F-1(pag))]2)
Glen_b -Reinstalar Monica
44
@Glen_b tiene razón. John Fox escribe en las páginas 35-36: "El error estándar de la orden estadística es S E ( X ( i ) ) = σX(yo)
Smi(X(yo))=σ^pag(zyo)PAGyo(1-PAGyo)norte
pag(z)PAG(z)X^(yo)=μ^+σ^zyoX^(yo)±2×Smi(X(yo))
2
F(F-1(pag))(pag(zyo)/ /σ^)

Respuestas:

6

FX(k)(X)=norte!(k-1)!(norte-k)![FX(X)]k-1[1-FX(X)]norte-kFX(X)
X(nortepag)UNnorte(F-1(pag),pag(1-pag)norte[F(F-1(pag))]2)

Como COOLSerdash menciona en los comentarios, John Fox [1] escribe en las páginas 35-36:

El error estándar de la estadística de orden X(yo) es

Smi(X(yo))=σ^pag(zyo)PAGyo(1-PAGyo)norte
dónde pag(z) es la función de densidad de probabilidad correspondiente a la FCD PAG(z). Los valores a lo largo de la línea ajustada están dados porX^(yo)=μ^+σ^zyo. Por lo tanto, un "sobre" de confianza aproximado del 95% alrededor de la línea ajustada esX^(yo)±2×Smi(X(yo)).

Entonces solo tenemos que reconocer que F(F-1(pag)) es estimado por (pag(zyo)/ /σ^).

[1] Fox, J. (2008),
Análisis de regresión aplicada y modelos lineales generalizados, 2ª ed. ,
Sage Publications, Inc

Glen_b -Reinstate a Monica
fuente