Cuando alguien dice que la desviación residual / df debería ~ 1 para un modelo de Poisson, ¿qué tan aproximado es aproximado?

16

A menudo he visto consejos para verificar si un ajuste del modelo de Poisson se dispersa en exceso o no, lo que implica dividir la desviación residual entre los grados de libertad. La relación resultante debe ser "aproximadamente 1".

La pregunta es de qué rango estamos hablando para "aproximados": ¿cuál es una relación que debería activar las alarmas para considerar formas de modelo alternativas?

Fomite
fuente
2
No es una respuesta a esta pregunta interesante, pero lo que haré a menudo es ejecutar varios modelos (por ejemplo, Poissson, NB, tal vez versiones infladas a cero) y compararlas, tanto en medidas de tipo AIC como en valores pronosticados.
Peter Flom - Restablece a Monica
Este enlace puede ser de interés. Especialmente la sección "Criterios para evaluar la bondad de ajuste".
@Procrastinator El enlace es un ejemplo perfecto de lo que estoy hablando: "Entonces, si nuestro modelo se ajusta bien a los datos, la relación de la Desviación a DF, Valor / DF, debería ser aproximadamente uno. Los valores de relación grandes pueden indicar el modelo especificación errónea o una variable de respuesta dispersa en exceso; las proporciones inferiores a uno también pueden indicar una especificación errónea del modelo o una variable de respuesta dispersa insuficiente ". ¿Cuál es el rango de "aproximadamente 1"? 0.99 a 1.01? 0,75 a 2?
Fomite
r-bloggers.com/… también tiene información sobre cómo responder a esta pregunta, aunque la respuesta de @ StasK la cubre bastante bien.
vuela el

Respuestas:

14

10 es grande ... 1.01 no lo es. Como la varianza de a es (consulte Wikipedia ), la desviación estándar de a es , y la de es . Esa es su medida: para , 1.01 no es grande, pero 2 es grande (7 sds de distancia). Para , 1.01 está bien, pero 1.1 no (a 7 sds de distancia).χk22kχ 2 kχk22kχk2/k2/kχ1002χ10,0002

StasK
fuente
1
"entonces tiene una desviación estándar de χk2/k "¿puede dirigirme a algún lugar que demuestre esto, por favor?2/k
baxx
amazon.com/… . Lamento ser un imbécil, pero esa es una distribución de referencia en inferencia estadística; Si no lo comprende, no debería trabajar con modelos lineales generalizados como Poisson.
StasK
2
Para futuras referencias, puede, en lugar del prefijo / disculpa por ser un imbécil, simplemente indicar la información y una referencia. Probablemente te ahorrará escribir y te hará parecer menos imbécil, lo que podría ser una experiencia novedosa.
baxx
Ver edición y la referencia de wikipedia. He ofrecido cientos de respuestas durante algunos años, así que admito que es un poco difícil para mí tener una experiencia realmente novedosa.
StasK
7

Asintóticamente, la desviación debe ser chi-cuadrado distribuido con una media igual a los grados de libertad. Divídalo por sus grados de libertad y debería obtener aproximadamente 1 si los datos no están demasiado dispersos. Para obtener una prueba adecuada, solo busque la desviación en las tablas de chi-cuadrado, pero tenga en cuenta (a) que la distribución de chi cuadrado es una aproximación y (b) que un valor alto puede indicar otros tipos de falta de ajuste (lo que quizás sea por eso 'alrededor de 1' se considera lo suficientemente bueno para el trabajo del gobierno).

Scortchi - Restablece a Monica
fuente