Tengo un conjunto de datos que esperaría seguir una distribución de Poisson, pero se dispersa en exceso aproximadamente 3 veces. Actualmente, estoy modelando esta sobredispersión usando algo como el siguiente código en R.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
Visualmente, esto parece encajar muy bien con mis datos empíricos. Si estoy satisfecho con el ajuste, ¿hay alguna razón por la que debería estar haciendo algo más complejo, como usar una distribución binomial negativa, como se describe aquí ? (Si es así, cualquier puntero o enlace al hacerlo sería muy apreciado).
Ah, y soy consciente de que esto crea una distribución ligeramente irregular (debido a la multiplicación por tres), pero eso no debería importar para mi aplicación.
Actualización: por el bien de cualquier otra persona que busque y encuentre esta pregunta, aquí hay una función R simple para modelar un poisson sobredispersado usando una distribución binomial negativa. Establezca d en la relación media / varianza deseada:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(a través de la lista de correo R: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )
fuente
Si su valor medio para el Poisson es 1500, entonces está muy cerca de una distribución normal; puede intentar usar eso como una aproximación y luego modelar la media y la varianza por separado.
fuente