Recientemente ajusté 4 modelos de regresión múltiple para los mismos datos de predicción / respuesta. Dos de los modelos que calzo con regresión de Poisson.
model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)
Dos de los modelos que calzo con regresión binomial negativa.
library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)
¿Hay alguna prueba estadística que pueda usar para comparar estos modelos? He estado usando el AIC como una medida del ajuste, pero AFAIK esto no representa una prueba real.
regression
aic
count-data
likelihood-ratio
model-comparison
Daniel Standage
fuente
fuente
model.nb.inter
es significativamente mejor que el demodel.pois.inter
. Sí, el AIC es más bajo, pero ¿cuánto más bajo constituye significativamente mejor ?model.pois
model.pois.inter
model.nb
model.nb.inter
Respuestas:
Puede comparar el modelo binomial negativo con el modelo de Poisson correspondiente con una prueba de razón de probabilidad. Un modelo de Poisson es equivalente a un modelo binomial negativo con un parámetro de sobredispersión de cero. Por lo tanto, son modelos anidados y las razones de probabilidad son válidas. La complicación es que el parámetro de sobredispersión está restringido a ser no negativo, es decir, lógicamente no puede ser menor que cero, por lo que la hipótesis nula se encuentra en el límite del espacio del parámetro. Esto significa que en lugar de comparar el doble de la probabilidad logarítmica con una distribución de chi-cuadrado con un grado de libertad, debe compararlo con una distribución de mezcla que consta de partes iguales de un chi-cuadrado con 1 df y una masa de punto en cero (una distribución chi-cuadrado con cero grados de libertad). Lo que eso significa en la práctica es que puedes calcular el valor p usando el chi-cuadrado con 1 df y luego reducirlo a la mitad. Para más detalles y antecedentes, vea el Caso 5 deSelf & Liang JASA 1987; 82 : 605-610. .
Tenga en cuenta que algunos paquetes de software estadístico, como Stata, lo harán todo automáticamente cuando se ajuste a un modelo binomial negativo. De hecho, descaradamente descarto gran parte de lo anterior del sistema de ayuda de Stata, si Stata lo ve
help j_chibar
.fuente
Creo que
anova()
R puede usarse para esto. A pesar de su nombre, es una prueba de razón de probabilidad. Crawley en su The R Book tiene algunos ejemplos de uso.fuente
Como notas principales, debido a que los modelos están anidados, puede realizar una prueba de razón de probabilidad.
En general, aunque eso no es cierto, por lo que si desea comparar modelos no anidados, puede usar la prueba de Vuong .
fuente