Entonces sabemos que una suma de poissons con parámetro es en sí misma un poisson con . Hipotéticamente, uno podría tomar y decir que en realidad es donde cada es: , y tome una gran n para que CLT funcione.
Esto (obviamente) no funciona. Supongo que esto tiene algo que ver con la forma en que CLT funciona "más rápido" para variables aleatorias que están "más cerca" de lo normal, y que cuanto más pequeña es lambda, más obtenemos una variable aleatoria que es mayormente 0 y rara vez varía algo más.
Sin embargo, lo que expliqué es mi intuición. ¿Hay alguna forma más formal de explicar por qué este es el caso?
¡Gracias!
Respuestas:
Estoy de acuerdo con @whuber en que la raíz de la confusión parece estar reemplazando la suma asintótica en CLT con algún tipo de división en su argumento. En CLT obtenemos la fijo distribución a continuación, dibuje n números x i de ella y calcular la suma ˉ x n = 1f(x,λ) n xi . Si seguimos aumentandon,entonces sucede algo interesante:
√x¯n=1n∑ni=1xi n
dondeμ,σ2son medias y la varianza de la distribuciónf(x
Lo que sugiere hacer con Poisson es algo al revés: en lugar de sumar las variables de una distribución fija , desea dividir la distribución fija en partes siempre cambiantes . En otras palabras, toma una variable de una distribución fija f ( x , λ ) y luego la divide en x i para que n ∑ i = 1 x i ≡ xx f(x,λ) xi
¿Qué dice CLT sobre este proceso? Nada. Tenga en cuenta que, en CLT, siempre hemos cambiado , y sudistribucióncambiantefn(x)que converge a unadistribuciónfijaN(0,σ2)n−−√(x¯n−μ) fn(x) N(0,σ2)
¡En su configuración, ni la suma ni su distribución f ( x , λ ) están cambiando! Están arreglados No están cambiando, no están convergiendo a nada. Entonces, CLT no tiene nada que decir sobre ellos.x f(x,λ)
Además, CLT no dice nada sobre el número de elementos en la suma. Puede tener una suma de 1000 variables de Poisson (0.001) y CLT no dirá nada sobre la suma. Todo lo que dice es que si sigues aumentando N, en algún momento esta suma comenzará a verse como una distribución normal . De hecho, si N = 1,000,000 obtendrá la aproximación cercana de la distribución normal.1N∑Ni=1xi,xi∼Poisson(0.001)
Su intuición es correcta solo sobre el número de elementos en la suma, es decir, más que la distribución inicial es diferente de lo normal, entonces más elementos que necesita sumar para llegar a la normalidad. La manera más formal (pero aún informal) sería examinado la función característica de Poisson: Si lambda > > 1 , que se obtiene con la expansión de Taylor (WRT t ) del exponente anidado: ≈ exp ( i λ t - λ / 2 t 2
Sin embargo, su intuición no se aplica correctamente: su desplazamiento de la suma en CLT con algún tipo de división arruina las cosas y hace que CLT sea inaplicable.
fuente
El problema con su ejemplo es que está permitiendo que los parámetros cambien comon cambia. El CLT le dice que para una distribución fija con una media finita y sd, como ,n→∞
,∑x−μn√→dN(0,σ)
donde y σ son de la media y sd de la distribución de x .μ σ x
Por supuesto, para diferentes distribuciones (es decir, más sesgadas, por ejemplo), se requieren más grandes antes de que la aproximación derivada de este teorema sea razonable. En su ejemplo, para λ m = 1 / m , un n > > m se requiere antes de la aproximación normal es razonable.n λm=1/m n>>m
EDITAR
Se discute cómo el CLT no se aplica a las sumas, sino a las sumas estandarizadas (es decir, no∑xi). En teoría, esto es cierto: la suma no estandarizada tendrá una distribución indefinida en la mayoría de los casos.∑xi/n−−√ ∑xi
Sin embargo, en la práctica, ¡ciertamente puede aplicar la aproximación justificada por el CLT a las sumas! Si puede aproximarse por un CDF normal para n grande , entonces ciertamente F ∑ x también puede hacerlo, ya que multiplicar por un escalar conserva la normalidad. Y puede ver esto de inmediato en este problema: recuerde que si X i ∼ P o i s ( λ ) , entonces Y = ∑ n i = 1 X i ∼ P o i s ( n λFx¯ n F∑x Xi∼Pois(λ) Y=∑ni=1Xi∼Pois(nλ) . Y todos aprendimos en nuestro curso de probabilidad de división superior que para grandes, el CDF de un P o i s ( λ ) puede aproximarse bastante bien por una normal con μ = λ , σ 2 = λ . Entonces, para cualquier λ fijo, podemos aproximarbastante bienel CDF de Y ∼ P o i s ( n λ ) con Φ ( y - n λλ Pois(λ) μ=λ σ2=λ λ Y∼Pois(nλ) Φ(y−nλnλ√) n λ>0 λ=0
Si bien el CLT no se aplica fácilmente a las sumas, la aproximación basada en el CLT ciertamente sí. Creo que esto es a lo que se refería el OP cuando discutía la aplicación del CLT a la suma.
fuente
La pregunta es, en mi opinión, más interesante si se piensa de manera más general, dejando que la distribución del padre Poisson dependa denorte , digamos con parámetro λnorte y λnorte= 1 as a special case. I think it's perfectly reasonable to ask why, and how we can understand that, a central limit theorem does not hold for the sum Sn=∑ni=1Xi,n . After all, it's common to apply a CLT even in problems where the distributions of the components of the sum depend on n . It's also common to decompose Poisson distributions as the distribution of a sum of Poisson variables, and then apply a CLT.
The key issue as I see it is that your construction implies the distribution ofXi,n depends on n in such a way that the parameter of the distribution of Sn does not grow in n . If you would instead have taken, for example, Sn∼Poi(n) and made the same decomposition, the standard CLT would apply. In fact, one can think of many decompositions of a Poi(λn) distribution that allows for application of a CLT.
The Lindeberg-Feller Central Limit Theorem for triangular arrays is often used to examine convergence of such sums. As you point out,Sn∼Poi(1) for all n , so Sn cannot be asymptotically normal. Still, examining the Lindeberg-Feller condition sheds some light on when decomposing a Poisson into a sum may lead to progress.
A version of the theorem may be found in these notes by Hunter. Lets2n=Var(Sn) . The Lindeberg-Feller condition is that, ∀ϵ>0 :
Now, for the case at hand, the variance of the terms in the sum is dying off so quickly inn that sn=1 for every n . For fixed n , we also have that the Xi,n are iid. Thus, the condition is equivalent to
But, for smallϵ and large n ,
which does not approach zero. Thus, the condition fails to hold. Again, this is as expected since we already know the exact distribution ofSn for every n , but going through these calculations gives some indications of why it fails: if the variance didn't die off as quickly in n you could have the condition hold.
fuente