Intrigado por una pregunta en math.stackexchange , e investigándolo empíricamente, me pregunto acerca de la siguiente declaración sobre la raíz cuadrada de sumas de variables aleatorias iid.
Supongamos que son variables aleatorias con media finita distinta de cero y varianza , y . El teorema del límite central dice medida que aumenta. μ σ 2 Y = n ∑ i = 1 X i Y - n μn
Si , ¿puedo decir algo como medida que aumenta?Z - √n
Por ejemplo, suponga que son Bernoulli con media y varianza , entonces es binomial y puedo simular esto en R, digamos con : p p ( 1 - p ) Y p = 1
set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))
que proporciona aproximadamente la media esperada y la varianza de
> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667
y una trama QQ que se parece a Gaussian
qqnorm(Z)
Respuestas:
La convergencia a un gaussiano es de hecho un fenómeno general.
Suponga que son variables aleatorias IID con media y varianza , y defina las sumas . Arreglar un número . El teorema del límite central habitual nos dice que como , donde es El estándar normal cdf. Sin embargo, la continuidad del cdf limitante implica que también tenemosX1,X2,X3,... μ>0 σ2 Yn=∑ni=1Xi α P(Yn−nμσn√≤α)→Φ(α) n→∞ Φ
Tomando raíces cuadradas, y notando que implica que , obtenemos En otras palabras, . Este resultado demuestra la convergencia a un gaussiano en el límite como .μ>0 P(Yn<0)→0
¿Significa esto que es una buena aproximación a para grande ? Bueno, podemos hacerlo mejor que esto. Como señala @Henry, suponiendo que todo sea positivo, podemos usar , junto con y la aproximación , para obtener la aproximación mejorada como se indica en la pregunta anterior. Tenga en cuenta también que todavía tenemos porquenμ−−−√ E[|Yn|−−−√] n E[Yn−−√]=E[Yn]−Var(Yn−−√)−−−−−−−−−−−−−−−√ E[Yn]=nμ Var(Yn−−√)≈σ24μ E[|Yn|−−−√]≈nμ−σ24μ−−−−−−−√
fuente