Teorema del límite central para raíces cuadradas de sumas de variables aleatorias iid

11

Intrigado por una pregunta en math.stackexchange , e investigándolo empíricamente, me pregunto acerca de la siguiente declaración sobre la raíz cuadrada de sumas de variables aleatorias iid.

Supongamos que son variables aleatorias con media finita distinta de cero y varianza , y . El teorema del límite central dice medida que aumenta. μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Si , ¿puedo decir algo como medida que aumenta?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Por ejemplo, suponga que son Bernoulli con media y varianza , entonces es binomial y puedo simular esto en R, digamos con : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

que proporciona aproximadamente la media esperada y la varianza deZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

y una trama QQ que se parece a Gaussian

qqnorm(Z)

ingrese la descripción de la imagen aquí

Enrique
fuente
1
@MichaelM: Gracias por esos comentarios. Empecé con el no negativo, pero pensé que el comportamiento asintótico intuitivo que describiste permitió una generalización a más distribuciones. Mis sorpresas fueron (a) la varianza de la raíz cuadrada de la suma que aparentemente tiende a una constante que no depende de y (b) la aparición de una distribución que se parece mucho a la gaussiana. Sería bienvenido un contraejemplo, pero cuando probé otros casos que inicialmente parecían no gaussianos, aumentar aún más parecía devolver la distribución a un resultado de tipo CLT. Xinn
Henry
Un corolario de esto es el (media o cuadrática) root--cuadrado medio de variables aleatorias iid escalados adecuadamente (multiplicar por como con una media aritmética) también converge a una distribución Gaussiana siempre que el º momento de la La distribución subyacente es finita. n4
Henry
3
Solo un breve comentario: el reclamo es un caso especial del método Delta, ver Teorema 5.5.24 en el libro "Inferencia estadística" de Casella & Berger.
Michael M
@Michael: Quizás vea algo que no soy en este momento, pero no creo que este problema en particular se ajuste a los supuestos del método Delta clásico (por ejemplo, como se indica en el teorema al que hace referencia). Tenga en cuenta que no converge en la distribución (no trivialmente en ) y, por lo tanto, "aplicar el método Delta con " no satisface los requisitos necesarios. Sin embargo, como lo demuestra la respuesta de S. Catterall, proporciona una heurística útil que conduce a la respuesta correcta. YRg(y)=|y|
cardenal
(Creo que podría adaptar la prueba del método Delta a casos similares a los anteriores para hacer completamente rigurosa la heurística antes mencionada.)
cardenal

Respuestas:

14

La convergencia a un gaussiano es de hecho un fenómeno general.

Suponga que son variables aleatorias IID con media y varianza , y defina las sumas . Arreglar un número . El teorema del límite central habitual nos dice que como , donde es El estándar normal cdf. Sin embargo, la continuidad del cdf limitante implica que también tenemosX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
porque el término adicional en el lado derecho de la desigualdad tiende a cero. Reorganizar esta expresión lleva a
P(Yn(ασ2μ+nμ)2)Φ(α)

Tomando raíces cuadradas, y notando que implica que , obtenemos En otras palabras, . Este resultado demuestra la convergencia a un gaussiano en el límite como .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

¿Significa esto que es una buena aproximación a para grande ? Bueno, podemos hacerlo mejor que esto. Como señala @Henry, suponiendo que todo sea positivo, podemos usar , junto con y la aproximación , para obtener la aproximación mejorada como se indica en la pregunta anterior. Tenga en cuenta también que todavía tenemos porquenμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 como .n
S. Catterall reinstala a Mónica
fuente
Es posible que deba agregar como para obtener mi resultadonμnμσ24μ0n
Henry
@Henry Puede reemplazar con para cualquier constante y esto no cambiará la distribución limitante, pero puede cambiar el grado en que es una buena aproximación a para grande específico . ¿Cómo se te ocurrió ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall reinstala a Monica el
Tenemos así que . Suponiendo que todo es positivo, mientras que el denominador de sugiere , y la combinación de estos conduce a . Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry
Ok, gracias, he tratado de cubrir esto en mi respuesta ahora.
S. Catterall reinstala a Monica el