¿Poisson es exponencial como lo es Gamma-Poisson?

16

Una distribución de Poisson puede medir eventos por unidad de tiempo, y el parámetro es λ . La distribución exponencial mide el tiempo hasta el próximo evento, con el parámetro 1λ . Uno puede convertir una distribución en la otra, dependiendo de si es más fácil modelar eventos u horarios.

Ahora, un gamma-poisson es un poisson "estirado" con una varianza mayor. Una distribución de Weibull es una exponencial "estirada" con una varianza mayor. Pero, ¿pueden estos dos convertirse fácilmente entre sí, de la misma manera que Poisson puede convertirse en exponencial?

¿O hay alguna otra distribución que sea más apropiada para usar en combinación con la distribución gamma-poisson?

El gamma-poisson también se conoce como distribución binomial negativa, o NBD.

zbicyclist
fuente

Respuestas:

14

Este es un problema bastante sencillo. Aunque existe una conexión entre las distribuciones binomial negativa y de Poisson, en realidad creo que esto no es útil para su pregunta específica, ya que alienta a las personas a pensar en procesos binomiales negativos. Básicamente, tiene una serie de procesos de Poisson:

Yi(ti)|λiPoisson(λiti)

Donde es el proceso y t i es el tiempo que lo observa, y i denota los individuos. Y usted dice que estos procesos son "similares" al vincular las tasas mediante una distribución:Yitii

λiGamma(α,β)

Al hacer la integración / mxixing sobre , tienes:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Esto tiene un pmf de:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Para obtener la distribución del tiempo de espera, notamos que:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Diferencie esto y tendrá el PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Este es un miembro de las distribuciones generalizadas de Pareto, tipo II. Usaría esto como su distribución del tiempo de espera.

Para ver la conexión con la distribución de Poisson, tenga en cuenta que , de modo que si establecemos β = ααβ=E(λi|αβ) y luego tomamos el límiteαobtenemos:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Esto significa que puedes interpretar como parámetro de sobredispersión.1α

probabilidadislogica
fuente
1
También puede observar que la distribución del tiempo de espera es, en términos generales, una distribución exponencial con un parámetro de frecuencia aleatoria Gamma y estrictamente hablando, esta es una distribución Beta del segundo tipo, como para cualquier distribución Gamma con un parámetro de frecuencia aleatoria Gamma.
Stéphane Laurent
Usando @probabilityislogic como base, encontré el siguiente artículo que proporciona más detalles sobre la relación entre NBD y Pareto: Gupta, Sunil y Donald G. Morrison. Estimación del heterogeneito en las tasas de compra de los consumidores. Marketing Science, 1991, 10 (3), 264-269. Gracias a todos los que me ayudaron a responder esta pregunta.
zbicyclist
+1, supongo que esta buena forma analítica ya no existe para , donde c es una constante. Poisson(λiti+c)c
Randel
1
@randel: puede obtener una forma "agradable" si observa que este rv es la suma de dos rvs independientes ... donde Y i es el mismo que el anterior y X ip o i s s o n ( c ) . Como X i no depende de λ i o Y i, el pdf de Z i es la convolución del pdf binomial negativo anterior y un pdf de poisson. Para obtener la distribución del tiempo de espera, simplemente multiplique P rZi=Yi+XiYiXipoisson(c)XiλiYiZi en la respuesta anterior por P r ( X i = 0 ) = e - c . Luego obtienes el tiempo de espera cdf de 1 - e - c ( 1 + t iPr(Yi=0)Pr(Xi=0)=ecy pdf dee-cα1ec(1+tiβ)α. ecαβ(1+tiβ)(α+1)
probabilityislogic
1
Esto no funcionará en términos de la distribución de mezcla, porque necesita (de lo contrario, la media de Poisson es negativa). La distribución de mezcla gamma necesitaría ser truncada (también supuse que c > 0 en mi respuesta anterior). Esto significaría que no hay distribución nb. λi<cti1c>0
probabilidadislogic
4

Una posibilidad: Poisson es Exponencial como Negativo-Binomial es ... ¡Exponencial!

Hay un proceso de Lévy que aumenta el salto puro llamado Proceso Binomial Negativo de tal manera que a veces el valor tiene una distribución binomial negativa. A diferencia del proceso de Poisson, los saltos no son casi seguros 1 . En cambio, siguen unadistribución logarítmica.t1 . Según la ley de la varianza total , parte de la varianza proviene del número de saltos (escalados por el tamaño promedio de los saltos), y parte de la varianza proviene del tamaño de los saltos, y puede usar esto para verificar que está sobredispersado.

Puede haber otras descripciones útiles. Ver "Enmarcar la distribución binomial negativa para la secuenciación del ADN".


Permítanme ser más explícito sobre cómo se puede construir el proceso binomial negativo descrito anteriormente.

  • Escoger p<1 .

  • Deje que ser IID con distribuciones logarítmicas, entonces P ( x i = k ) = - 1X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Sea un proceso de Poisson con velocidad constante - log ( 1 - p ) , entonces N ( t ) = Pois ( - t log ( 1)Nlog(1p)N(t)=Pois(tlog(1p)).

  • Dejar NBP

NBP(t)=i=1N(t)Xi.

NBPlog(1p).

NBP(t)NB(t,p) cuando introdujo la distribución logarítmica para analizar las frecuencias relativas de las especies.

Douglas Zare
fuente
1
No, cualquier proceso compuesto de Poisson tiene un tiempo de espera exponencial. Esto significa que agregasPois(λt)IID variables aleatorias con alguna distribución.
Douglas Zare
No, eso no es lo que se entiende por un proceso compuesto de Poisson. en.wikipedia.org/wiki/Compound_Poisson_process "Los saltos llegan aleatoriamente de acuerdo con un proceso de Poisson y el tamaño de los saltos también es aleatorio, con una distribución de probabilidad especificada". No dije IID variables de Poisson. Tomas elnorteth suma parcial de variables aleatorias logarítmicas IID donde nortees el valor de un proceso de Poisson.
Douglas Zare
Si multiplica un proceso de Poisson por 2, este no es un proceso de Poisson y los tiempos de espera siguen siendo exponenciales.
Douglas Zare
0

Todavía no puedo comentar, así que me disculpo porque esta no es una solución definitiva.

Está solicitando la distribución adecuada para usar con un NB pero apropiado no está completamente definido. Si una distribución apropiada significa apropiada para explicar los datos y usted está comenzando con un Poisson sobredispersado, entonces es posible que tenga que investigar más a fondo la causa de la sobredispersión. El NB no distingue entre un Poisson con medios heterogéneos o una dependencia de ocurrencia positiva (que un evento ocurra aumenta la probabilidad de que ocurra otro). En el tiempo continuo también hay dependencia de la duración, por ejemplo, la dependencia positiva de la duración significa que el paso del tiempo aumenta la probabilidad de que ocurra. También se demostró que la dependencia de duración negativa asintóticamente causa un Poisson sobredispersado [1] . Esto se agrega a la lista de lo que podría ser el modelo de tiempo de espera apropiado.

Alondra Bradsher
fuente
1
causa de la sobredispersión: estos son datos de compra del consumidor. Los consumidores individuales son poisson, cada uno con una tasa de compra lambda. Pero no todos los consumidores tienen la misma lambda, esa es la causa de la sobredispersión. Las tasas de compra lambda se consideran distribuidas como gamma. Este es un modelo común (se remonta a ASC Ehrenberg), pero no he encontrado nada en su escrito que responda a esta pregunta.
zbicyclist