Debido al factorial en una distribución de Poisson, resulta poco práctico estimar los modelos de Poisson (por ejemplo, utilizando la máxima probabilidad) cuando las observaciones son grandes. Entonces, por ejemplo, si estoy tratando de estimar un modelo para explicar el número de suicidios en un año determinado (solo hay datos anuales disponibles) y decir que hay miles de suicidios cada año, ¿es incorrecto expresar suicidios en cientos? , de modo que 2998 sería 29.98 ~ = 30? En otras palabras, ¿está mal cambiar la unidad de medida para que los datos sean manejables?
n!
=Gamma(n+1)
para n> = 0. Intente buscar una función llamadaGamma
si necesita calcular el factorial (o log Gamma si está calculando la probabilidad de log)Me temo que no puedes hacer eso. Como dice @Baltimark, con la gran lambda la distribución tendrá una forma más normal (simétrica), y al reducirla ya no será una distribución de Poisson. Pruebe el siguiente código en R:
El resultado está abajo:
Puede ver que el poisson de escala reducida (línea roja) es completamente diferente de la distribución de poisson.
fuente
Simplemente puede ignorar el 'factorial' cuando usa la máxima probabilidad. Aquí está el razonamiento para su ejemplo de suicidio. Dejar:
λ: Sea el número esperado de suicidios por año
k i : Sea el número de suicidios en el año i.
Entonces maximizaría la probabilidad de registro como:
LL = ∑ (k i log (λ) - λ - k i !)
Maximizar lo anterior es equivalente a maximizar lo siguiente como k i ! es una constante
LL ' = ∑ (k i log (λ) - λ)
¿Podría explicar por qué el factorial es un problema? ¿Me estoy perdiendo de algo?
fuente