Si tengo variables aleatorias que son Poisson distribuidas con parámetros , ¿cuál es la distribución de (es decir, el piso entero del promedio)?
Una suma de Poissons también es Poisson, pero no tengo suficiente confianza en las estadísticas para determinar si es lo mismo para el caso anterior.
poisson-distribution
average
Lubo Antonov
fuente
fuente
Respuestas:
Una generalización de la pregunta pide la distribución deY= ⌊ X/ m⌋ cuando la distribución de X es conocida y apoyada en los números naturales. (En la pregunta, X tiene una distribución de Poisson de parámetro λ = λ1+ λ2+ ⋯ + λnorte y m = n ).
La distribución de se determina fácilmente por la distribución de m Y , cuya probabilidad de generación de función (PGF) puede determinarse en términos de la PGF de X . Aquí hay un resumen de la derivación.Y m Y X
Porque esto converge absolutamente para , podemos reorganizar los términos en una suma de piezas de la formaEl | x | ≤ 1
para . La serie de potencias de las funciones consiste en cada término de la serie de comienza con : esto a veces se denomina diezmado de . Las búsquedas de Google actualmente no muestran mucha información útil sobre decimaciones, así que para completar, aquí hay una derivación de una fórmula.x t D m , t p m th p t th pt = 0 , 1 , ... , m - 1 Xtrem , tpag metroth pag tth pag
Sea cualquier primitiva raíz de la unidad; por ejemplo, tome . Luego se deduce de y quem º ω = exp ( 2 i π / m ) ω m = 1 Σ m - 1 j = 0 ω j = 0ω metroth ω = exp( 2 i π/ m) ωmetro= 1 ∑m - 1j = 0ωj= 0
Para ver esto, tenga en cuenta que el operador es lineal, por lo que es suficiente verificar la fórmula sobre la base . Aplicando el lado derecho a da { 1 , x , x 2 , ... , x n , ... } x nXtrem , t { 1 , x , x2, ... , xnorte, ... } Xnorte
Cuando y difieren en un múltiplo de , cada término en la suma es igual a y se obtiene . De lo contrario, los términos pasan por los poderes de y estos suman cero. De donde este operador conserva todos los poderes de congruentes con módulo y mata a todos los demás: es precisamente la proyección deseada.n m 1 x n ω t - n x t mt norte metro 1 Xnorte ωt - n X t metro
Sigue fácilmente una fórmula para cambiando el orden de suma y reconociendo una de las sumas como geométrica, escribiéndola así en forma cerrada:q
Por ejemplo, el pgf de una distribución de Poisson del parámetro es . Con , y el pgf de seráp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλ p ( x ) = exp(λ(x−1)) m=2 ω=−1 2Y
Un uso de este enfoque es calcular momentos de y . El valor de la derivada del pgf evaluado en es el momento factorial . El momento es una combinación lineal de los primeros momentos factoriales. Usando estas observaciones, encontramos, por ejemplo, que para una distribuida por Poisson , su media (que es el primer momento factorial) es igual a , la media de es igual a , y la media de es igual am Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1X mY kth x=1 kth kth k X λ 2⌊(X/2)⌋ 3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ−12+12e−2λ 3⌊(X/3)⌋ λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Las medias para se muestran en azul, rojo y amarillo, respectivamente, como funciones de : asintóticamente, la media cae en comparación con la media original de Poisson.λ ( m - 1 ) / 2m=1,2,3 λ (m−1)/2
Se pueden obtener fórmulas similares para las variaciones. (Se vuelven desordenados a medida que aumenta y, por lo tanto, se omiten. Una cosa que establecen definitivamente es que cuando no hay múltiplo de es Poisson: no tiene la igualdad característica de media y varianza) Aquí hay una gráfica de las variaciones en función de para :m > 1 Y λ m = 1 , 2 , 3m m>1 Y λ m=1,2,3
Es interesante que para valores mayores de las variaciones aumentan . Intuitivamente, esto se debe a dos fenómenos competitivos: la función de piso efectivamente agrupa grupos de valores que originalmente eran distintos; Esto debe hacer que la varianza disminuya. Al mismo tiempo, como hemos visto, los medios también están cambiando (porque cada bin está representado por su valor más pequeño); esto debe hacer que se vuelva a agregar un término igual al cuadrado de la diferencia de medias. El aumento en la varianza para grandes hace mayor con valores mayores de .λ mλ λ m
El comportamiento de la varianza de con es sorprendentemente complejo. Terminemos con una simulación rápida (in ) que muestre lo que puede hacer. Las gráficas muestran la diferencia entre la varianza de y la varianza de para Poisson distribuido con varios valores de varían de a . En todos los casos, las gráficas parecen haber alcanzado sus valores asintóticos a la derecha.m m ⌊ X / m ⌋ X X λ 1 5000mY m m⌊X/m⌋ X X λ 1 5000
R
fuente
sapply()
para simulación. Gracias.Como dice Michael Chernick, si las variables aleatorias individuales son independientes, entonces la suma es Poisson con parámetro (media y varianza) que podría llamar . λ∑nortei = 1λyo λ
Dividir entre reduce la media a y la varianza por lo que la varianza será menor que la distribución de Poisson equivalente. Como dice Michael, no todos los valores serán enteros.λ / n λ / n 2norte λ / n λ/n2
El uso de la función de piso reduce la media ligeramente, aproximadamente , y también afecta la varianza ligeramente, aunque de una manera más complicada. Aunque tiene valores enteros, la varianza seguirá siendo sustancialmente menor que la media y, por lo tanto, tendrá una distribución más estrecha que el Poisson.12−12n
fuente
La función de masa de probabilidad del promedio de variables aleatorias independientes de Poisson se puede escribir explícitamente, aunque la respuesta podría no serle de gran ayuda. Como Michael Chernick señaló en los comentarios sobre su propia respuesta, la suma de las variables aleatorias independientes de Poisson con los parámetros respectivos es una variable aleatoria de Poisson con el parámetro . Por lo tanto, tanto, es una variable aleatoria que toma el valor con probabilidad∑ i X i X i λ i λ = ∑ i λ i P { n ∑ i = 1 X i = k } = exp ( - λ ) λ kn ∑iXi Xi λi λ=∑iλi
fuente
Y no será Poisson. Tenga en cuenta que las variables aleatorias de Poisson toman valores enteros no negativos. Una vez que divide por una constante, crea una variable aleatoria que puede tener valores no enteros. Seguirá teniendo la forma del Poisson. Es solo que las probabilidades discretas pueden ocurrir en puntos no enteros.
fuente