Residuos de desviación de Pearson VS en regresión logística

16

Sé que los Residuos de Pearson estandarizados se obtienen de una manera probabilística tradicional:

ri=yiπiπi(1πi)

y los residuos de desviación se obtienen de una manera más estadística (la contribución de cada punto a la probabilidad):

di=si2[yilogπi^+(1yi)log(1πi)]

donde = 1 si y i = 1 y s i = -1 si y i = 0.siyisiyi

¿Me puede explicar, intuitivamente, cómo interpretar la fórmula para los residuos de desviación?

Además, si quiero elegir uno, ¿cuál es más adecuado y por qué?

Por cierto, algunas referencias afirman que derivamos los residuos de desviación basados ​​en el término

12ri2

donde se menciona arriba.ri

Jack Shi
fuente
Cualquier idea sería apreciada
Jack Shi
1
Cuando dices "algunas referencias" ... ¿qué referencias y cómo lo hacen?
Glen_b -Reinstate a Monica el

Respuestas:

10

La regresión logística busca maximizar la función de probabilidad de registro

LL=kln(Pi)+rln(1Pi)

PiY^=1kY=1rY=0

Esa expresión es igual a

LL=(kdi2+rdi2)/2

porque la desviación residual de un caso se define como:

reyo={-2En(PAGyo)Si Yyo=1--2En(1-PAGyo)Si Yyo=0 0

Por lo tanto, la regresión logística binaria busca directamente minimizar la suma de los residuos de desviación al cuadrado. Los residuales de desviación están implicados en el algoritmo ML de la regresión.

La estadística Chi-sq del ajuste del modelo es 2(LLmodelo completo-LLmodelo reducido), donde el modelo completo contiene predictores y el modelo reducido no.

ttnphns
fuente