Estoy tratando de encontrar la distribución de probabilidad de una suma de un número aleatorio de variables que no están distribuidas de manera idéntica. Aquí hay un ejemplo:
John trabaja en un centro de atención al cliente. Recibe llamadas con problemas y trata de resolverlos. Los que no puede resolver, los reenvía a su superior. Supongamos que la cantidad de llamadas que recibe en un día sigue una distribución de Poisson con media . La dificultad de cada problema varía desde cosas bastante simples (que definitivamente puede tratar) hasta preguntas muy especializadas que no sabrá cómo resolver. Suponga que la probabilidad que pueda resolver el i -ésimo problema sigue una distribución Beta con los parámetros y y es independiente de los problemas anteriores. ¿Cuál es la distribución de la cantidad de llamadas que resuelve en un día?p iβ
Más formalmente, tengo:
para
donde , y( X i | p i ) ∼ B e r n o u l l i ( p i ) p i ∼ B e t a ( α , β )
Tenga en cuenta que, por ahora, estoy feliz de asumir que las son independientes. También acepto que los parámetros y no se afectan entre sí, aunque en un ejemplo real de esto cuando es grande, los parámetros y son tales que la distribución Beta tiene más masa en bajas tasas de éxito . Pero ignoremos eso por ahora. μ , α β μ α β p
Puedo calcular pero eso es todo. También puedo simular valores para tener una idea de cómo se ve la distribución de (se parece a Poisson pero no sé si eso se debe a los números de y que probé o si se generaliza, y cómo podría cambiar para diferentes valores de parámetros). ¿Alguna idea de qué es esta distribución o cómo podría derivarla?Y μ , α β
Tenga en cuenta que también publiqué esta pregunta en el foro TalkStats, pero pensé que podría recibir más atención aquí. Disculpas por la publicación cruzada y muchas gracias de antemano por su tiempo.
EDITAR : Como resulta (ver las respuestas muy útiles a continuación, ¡y gracias por eso!), De hecho es una distribución , algo que estaba adivinando en base a mi intuición y algunas simulaciones, pero no pude demostrarlo. Sin embargo, lo que ahora encuentro sorprendente es que la distribución de Poisson solo depende de la media de la distribución pero no se ve afectada por su varianza.Beta
Como ejemplo, las siguientes dos distribuciones Beta tienen la misma media pero varianza diferente. Para mayor claridad, el pdf azul representa un y el rojo .B e t a ( 0,75 , 0,75 )
Sin embargo, ambos darían como resultado la misma distribución que, para mí, parece un poco contra-intuitiva. (No digo que el resultado sea incorrecto, ¡simplemente sorprendente!)
fuente
Respuestas:
Las llamadas (es decir, la ) llegan de acuerdo con un proceso de Poisson. El número total de llamadas sigue una distribución de Poisson. Divida las llamadas en dos tipos, por ejemplo, si o . El objetivo es determinar el proceso que genera los s. Esto es trivial si con una probabilidad fija : según el principio de superposición de los procesos de Poisson, el proceso completo reducido a solo s también sería un proceso de Poisson, con una tasa . De hecho, este es el caso, solo necesitamos un paso adicional para llegar allí. N X i = 1 X i = 0 1 X i = 1 p 1 p μXyo norte Xyo= 1 Xyo= 0 1 Xyo= 1 pag 1 p μ
Marginar sobre , de modo que P r ( X i | α , β ) = ∫ 1 0 p X i i ( 1 - p i ) 1 - X i p α - 1 i ( 1 - p i ) β - 1pagyo
Donde es la función beta. Usando el hecho de que , lo anterior se simplifica a; Γ(x+1)=xΓ(x)si( a , b ) = Γ ( a ) Γ ( b )Γ ( a + b ) Γ ( x + 1 ) = x Γ ( x )
Xi∼Bernoulli(α
Un ejemplo numérico (con R) ... en la figura, las líneas verticales son de simulación y los puntos rojos son los pmf derivados arriba:
fuente
Como es una variable aleatoria con un , tiene y esta es, de hecho, la probabilidad que Juan realmente resuelve el ª problema, independientemente de todas las demás.pagyo Beta( α, β) E [ pyo] = αα + β yo
Como el número total de problemas en un día tiene una distribución de Poisson con el parámetro y cada uno se resolverá con probabilidad , el número que John resuelve cada día tiene una distribución de Poisson con el parámetroμ αα + β μ αα + β
Su cálculo de la probabilidad de que no resuelva ningún problema debe serP (Y= 0 ) = e- μ α / ( α + β)
fuente