Este es un problema bastante sencillo. Aunque existe una conexión entre las distribuciones binomial negativa y de Poisson, en realidad creo que esto no es útil para su pregunta específica, ya que alienta a las personas a pensar en procesos binomiales negativos. Básicamente, tiene una serie de procesos de Poisson:
Yi(ti)|λi∼Poisson(λiti)
Donde es el proceso y t i es el tiempo que lo observa, y i denota los individuos. Y usted dice que estos procesos son "similares" al vincular las tasas mediante una distribución:Yitii
λi∼Gamma(α,β)
Al hacer la integración / mxixing sobre , tienes:λi
Yi(ti)|αβ∼NegBin(α,pi)wherepi=titi+β
Esto tiene un pmf de:
Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!pyii(1−pi)α
Para obtener la distribución del tiempo de espera, notamos que:
= 1 - ( 1 - p i ) α = 1 - ( 1 +
Pr(Ti≤ti|αβ)=1−Pr(Ti>ti|αβ)=1−Pr(Yi(ti)=0|αβ)
=1−(1−pi)α=1−(1+tiβ)−α
Diferencie esto y tendrá el PDF:
pTi(ti|αβ)=αβ(1+tiβ)−(α+1)
Este es un miembro de las distribuciones generalizadas de Pareto, tipo II. Usaría esto como su distribución del tiempo de espera.
Para ver la conexión con la distribución de Poisson, tenga en cuenta que , de modo que si establecemos β = ααβ=E(λi|αβ) y luego tomamos el límiteα→∞obtenemos:β=αλα→∞
limα→∞αβ(1+tiβ)−(α+1)=limα→∞λ(1+λtiα)−(α+1)=λexp(−λti)
Esto significa que puedes interpretar como parámetro de sobredispersión.1α
Una posibilidad: Poisson es Exponencial como Negativo-Binomial es ... ¡Exponencial!
Hay un proceso de Lévy que aumenta el salto puro llamado Proceso Binomial Negativo de tal manera que a veces el valor tiene una distribución binomial negativa. A diferencia del proceso de Poisson, los saltos no son casi seguros 1 . En cambio, siguen unadistribución logarítmica.t 1 . Según la ley de la varianza total , parte de la varianza proviene del número de saltos (escalados por el tamaño promedio de los saltos), y parte de la varianza proviene del tamaño de los saltos, y puede usar esto para verificar que está sobredispersado.
Puede haber otras descripciones útiles. Ver "Enmarcar la distribución binomial negativa para la secuenciación del ADN".
Permítanme ser más explícito sobre cómo se puede construir el proceso binomial negativo descrito anteriormente.
Escogerp<1 .
Deje que ser IID con distribuciones logarítmicas, entonces P ( x i = k ) = - 1X1,X2,X3,... P(xi=k)=−1log(1−p)pkk.
Sea un proceso de Poisson con velocidad constante - log ( 1 - p ) , entonces N ( t ) = Pois ( - t log ( 1)N −log(1−p) N(t)=Pois(−tlog(1−p)).
DejarNBP
fuente
Todavía no puedo comentar, así que me disculpo porque esta no es una solución definitiva.
Está solicitando la distribución adecuada para usar con un NB pero apropiado no está completamente definido. Si una distribución apropiada significa apropiada para explicar los datos y usted está comenzando con un Poisson sobredispersado, entonces es posible que tenga que investigar más a fondo la causa de la sobredispersión. El NB no distingue entre un Poisson con medios heterogéneos o una dependencia de ocurrencia positiva (que un evento ocurra aumenta la probabilidad de que ocurra otro). En el tiempo continuo también hay dependencia de la duración, por ejemplo, la dependencia positiva de la duración significa que el paso del tiempo aumenta la probabilidad de que ocurra. También se demostró que la dependencia de duración negativa asintóticamente causa un Poisson sobredispersado [1] . Esto se agrega a la lista de lo que podría ser el modelo de tiempo de espera apropiado.
fuente