Para analizar los recuentos de aves inflados a cero, me gustaría aplicar modelos de recuento inflados a cero usando el paquete R pscl . Sin embargo, al observar el ejemplo proporcionado en la documentación para una de las funciones principales ( ? Zeroinfl ), empiezo a dudar de cuál es la verdadera ventaja de estos modelos. De acuerdo con el código de muestra dado allí, calculé modelos de poisson estándar, cuasi-poisson y bionomiales negativos, modelos de poisson simples y binomiales negativos inflados a cero y modelos de poisson y binomios negativos inflados a cero con regresores para el componente cero. Luego inspeccioné los histogramas de los datos observados y ajustados. (Aquí está el código para replicar eso).
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
No puedo ver ninguna diferencia fundamental entre los diferentes modelos (aparte de eso, los datos de ejemplo no me parecen muy "inflados a cero" ...); en realidad ninguno de los modelos produce una estimación razonablemente a medias de la cantidad de ceros. ¿Alguien puede explicar cuál es la ventaja de los modelos con inflación cero? Supongo que debe haber una razón para elegir esto como ejemplo para la función.
fuente