Residuos en regresión de Poisson

9

Zuur 2013 Beginners Guide to GLM & GLMM sugiere validar una regresión de Poisson trazando los residuos de Pearson contra los valores ajustados. Zuur afirma que no deberíamos ver los residuos desplegándose a medida que aumentan los valores ajustados, como el gráfico adjunto (dibujado a mano).

Pero pensé que una característica clave de la distribución de Poisson es que la varianza aumenta a medida que aumenta la media. Entonces, ¿no deberíamos esperar ver una variación creciente en los residuos a medida que aumentan los valores ajustados?

ingrese la descripción de la imagen aquí

luciano
fuente

Respuestas:

25

La distinción es clara tan pronto como comprenda qué es un residuo de Pearson.

Tiene razón en que para un modelo de Poisson, la varianza aumenta a medida que aumenta la media.

Como resultado, los residuos en bruto ordinarios (ri=yiμ^i) debe tener una extensión que aumente con los valores ajustados (aunque no en proporción).

Sin embargo, los residuos de Pearson son residuos divididos por la raíz cuadrada de la varianza según el modelo (riP=yiμ^iμ^ipara un modelo de Poisson). Esto significa que si el modelo es correcto, los residuos de Pearson deben tener una extensión constante.

Gráficos residuales de un modelo de regresión de Poisson simulado simple.  Gráfico de la izquierda: los residuos brutos frente a la media ajustada muestran una extensión creciente con la media.  Hay "bandas" diagonales en los residuos porque los datos son discretos.  Gráfico a la derecha: los residuos de Pearson muestran lo que parece una extensión constante a medida que cambian las medias, y las bandas diagonales ahora están curvadas.

Glen_b -Reinstate a Monica
fuente
¿Podría aclarar por qué escribe que estamos dividiendo por la raíz cuadrada de la varianza cuando en realidad está dividiendo por la raíz cuadrada del valor esperado? Sé que la varianza es igual a la media para una distribución de Poisson, pero es una constante para una distribución particular, entonces, ¿de qué varianza estamos hablando aquí?
kdarras
1
La distribución condicional de la respuesta puede ser diferente en cada combinación de predictores. De ahí el uso del subíndice en la media;μi es la media poblacional (y por lo tanto también la varianza de la población) para observación i, dados sus valores predictores (los valores de sus IV).
Glen_b -Reinstala a Monica