Estoy tratando de modelar las intensidades medias de parásitos que afectan a un huésped en R usando un modelo binomial negativo. Sigo recibiendo 50 o más advertencias que dicen:
In dpois(y, mu, log = TRUE) : non-integer x = 251.529000
¿Cómo puedo lidiar con esto? Mi código se ve así:
mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season, data=MI.df)
Respuestas:
El binomio negativo es una distribución de datos de recuento, por lo que realmente desea que su variable de respuesta sea recuento (es decir, números enteros no negativos). Dicho esto, es apropiado tener en cuenta "diferentes esfuerzos de muestreo" (no sé exactamente a qué se refiere, pero entiendo lo esencial). Sin embargo, no debe intentar hacerlo dividiendo sus cuentas por otro número. En cambio, debe usar ese otro número como compensación . Hay una buena discusión sobre el CV de lo que es un desplazamiento aquí: ¿ Cuándo usar un desplazamiento en una regresión de Poisson? Supongo que su modelo debería ser algo como:
fuente
cbind()
.Es una advertencia, no un error fatal. glm.nb () espera contar como su variable de resultado, que son enteros. Sus datos no son enteros: 251.529.
R dice "Hmmm ... es posible que desee comprobar esto y asegurarse de que está bien, porque puede que no parezca correcto". Si mi memoria es correcta, SPSS no da tal advertencia.
Si está seguro de que está utilizando el modelo correcto, aunque no tenga enteros, ignórelo y continúe.
fuente
Soy un parasitólogo ecológico ... la forma en que debe manejar esto es uniendo los hosts que fueron parasitados y los que no lo fueron, y luego usando una distribución binomial ... vea el código a continuación.
Tampoco he usado nunca un glm con más de una variable y ... así que digamos que quieres mirar las larvas parasitadas: tendrías # de larvas sanas y las # que estaban parasitadas.
Digamos: Lh y Lp
Así por ejemplo
parasitizedL = cbind (Lp, Lh) hist (parasitized) # Supongo que puede usar una distribución binomial regular w / glm ... y puede que no necesite el modelo binomial negativo PLarvae1 = glm (parasitizedL ~ B.type + Month + Season, familia = binomio, datos = MI.df)
luego haga una reducción gradual del modelo para ver cuáles de sus factores afectan significativamente el parasitismo ... vea el siguiente enlace
http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html
sin embargo, parece que necesita tener efectos aleatorios para tener en cuenta el muestreo repetitivo ... por lo que es probable que su efecto aleatorio sea (1 | Temporada / Mes) ... pero difícil de saber sin conocer sus datos
fuente