Deviance vs Pearson bondad de ajuste

8

Estoy tratando de llegar a un modelo utilizando la regresión binomial negativa (GLM binomial negativa). Tengo un tamaño de muestra relativamente pequeño (mayor que 300), y los datos no están escalados. Noté que hay dos formas de medir la bondad de ajuste: una es la desviación y la otra es la estadística de Pearson. ¿Cómo puedo determinar qué medida de bondad de ajuste usar? ¿Hay algunos criterios que pueda analizar al seleccionar la medida de bondad de ajuste?

Jin-Dominique
fuente
No estoy seguro de lo que quiere decir con "Tengo un tamaño de muestra relativamente pequeño (mayor que 300)".
Dason
@Dason 300 no es un número muy grande en la expresión de genes similares
HelloWorld

Respuestas:

10

La prueba de bondad de ajuste basada en la desviación es una prueba de razón de probabilidad entre el modelo ajustado y el saturado (uno en el que cada observación obtiene su propio parámetro). La prueba de Pearson es una prueba de puntaje; el valor esperado de la puntuación (la primera derivada de la función de log-verosimilitud) es cero si el modelo ajustado es correcto, y está tomando una mayor diferencia de cero como evidencia más fuerte de falta de ajuste. La teoría se discute en Smyth (2003), "Estadística de bondad de ajuste de Pearson como estadística de prueba de puntaje", Estadística y ciencia: un Festschrift para Terry Speed .

En la práctica, la gente suele confiar en la aproximación asintótica de ambos a la distribución de chi cuadrado; para un modelo binomial negativo, esto significa que los recuentos esperados no deberían ser demasiado pequeños. Smyth señala que la prueba de Pearson es más robusta contra la especificación errónea del modelo, ya que solo considera el modelo ajustado como nulo sin tener que asumir una forma particular para un modelo saturado. Nunca he notado mucha diferencia entre ellos.

Es posible que desee reflejar que una falta de ajuste significativa con cualquiera le dice lo que probablemente ya sepa: que su modelo no es una representación perfecta de la realidad. Es más probable que le digan esto cuanto mayor sea el tamaño de su muestra. Quizás una pregunta más relevante es si puede o no mejorar su modelo, y qué métodos de diagnóstico pueden ayudarlo.

Scortchi - Restablece a Monica
fuente