Otra pregunta más sobre el teorema del límite central

11

Sea una secuencia de variables aleatorias independientes de Bernoulli con Establezca Demuestre que converge en distribución a la variable normal estándar ya que tiende al infinito.{Xn:n1}

P{Xk=1}=1P{Xk=0}=1k.
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
SnBnZn

Mi intento es usar el CLT de Lyapunov, por lo tanto, debemos mostrar que existe un tal que, δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Establezca δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
y
Bn3=(k=1n1k1k2)(k=1n1k1k2)

Al evaluar las n grandes en la computadora, muestra cómo k=1nE|Xkk1|3 y Bn3 como n . Pero Bn3 aumenta más rápido que Bn2 por lo que k=1nE|Xkk1|3Bn30 . ¿Alguien puede ayudarme a demostrar que esta convergencia se mantiene?

TiffanyButterfly
fuente
77
Este es el ejemplo 27.3 de Probabilidad y medida de Patrick Billingsley.
Zhanxiong

Respuestas:

10

Puede ser instructivo demostrar este resultado a partir de los primeros principios y resultados básicos , explotando las propiedades de las funciones generadoras acumulativas (exactamente como en las pruebas estándar del Teorema del límite central). Requiere que comprendamos la tasa de crecimiento de los números armónicos generalizados para Estas tasas de crecimiento son bien conocidas y fáciles de obtener en comparación con las integrales : convergen para y de lo contrario divergen logarítmicamente para .

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

Deje y . Por definición, la función de generación acumulativa (cgf) de esn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

La expansión en serie del lado derecho, obtenida de la expansión de alrededor de , toma la formalog(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

Los numeradores de las fracciones son polinomios en con el término principal . Debido a que la expansión del registro converge absolutamente para , esta expansión converge absolutamente cuandokkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(En caso de que converja en todas partes). Para fijo y valores crecientes de , la divergencia (obvia) de implica que el dominio de convergencia absoluta crece arbitrariamente grande. Por lo tanto, para cualquier fijo y suficientemente grande , esta expansión converge absolutamente.k=1knBntn

Por lo tanto , para suficientemente grande , entonces podemos sumar el individuo sobre término por término en potencias de para obtener el cgf de ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Tomar los términos en las sumas sobre uno a la vez requiere que evaluemos expresiones proporcionales ak

b(s,j)=1Bnjk=1nks

para y . Utilizando las asíntotas de los números armónicos generalizados mencionados en la introducción, se deduce fácilmente dej3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

ese

b(1,j)(log(n))1j/20

y (para )s>1

b(s,j)(log(n))j/20

a medida que crece grande. Por consiguiente, todos los términos en la expansión de más allá de convergen a cero, de donde converge a para cualquier valor de . Dado que la convergencia de la cgf implica la convergencia de la función característica, del teorema de continuidad de Levy concluimos que acerca a una variable aleatoria cuya cgf es 2/2 : esa es la variable normal estándar, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Este análisis revela cuán delicada es la convergencia: mientras que en muchas versiones del Teorema del límite central el coeficiente de es (para ), aquí el coeficiente es solo : la convergencia es mucho más lenta. En este sentido, la secuencia de variables estandarizadas "apenas" se vuelve Normal.tjO(n1j/2)j3O(((log(n))1j/2)

Podemos ver esta lenta convergencia en una serie de simulaciones. Los histogramas muestran iteraciones independientes para cuatro valores de . Las curvas rojas son gráficos de funciones de densidad normal estándar para referencia visual. Aunque evidentemente hay una tendencia gradual hacia la normalidad, incluso en (donde todavía es considerable) sigue habiendo una no normalidad apreciable, como lo demuestra la asimetría (igual a en esta muestra). (No sorprende que la asimetría de este histograma esté cerca de , porque ese es precisamente el término en el cgf).105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Figura: histogramas para n = 30, 100, 300, 1000

Aquí está el Rcódigo para aquellos que deseen experimentar más.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}
whuber
fuente
6

Ya tienes una gran respuesta. Si también desea completar su propia prueba, puede argumentar de la siguiente manera:

Como converge para todo y diverge para ( aquí ), podemos escribirk=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

Por el mismo argumento,

Bn2=k=1n1k+O(1).

En consecuencia, y, por lo tanto,S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

que es lo que queríamos mostrar

ekvall
fuente
2

Primero, sus variables aleatorias no se distribuyen de manera idéntica si las distribuciones dependen de ;)k

Además, no usaría su notación como:Bn

  • Las letras mayúsculas suelen reservarse para variables aleatorias.
  • es solo la suma de las variaciones, por lo que usaría una notación que involucre un símbolo para hacer esto obvio.σ

Luego, con respecto a la pregunta, no sé si se trata de un ejercicio o una investigación y qué herramientas se les permite usar. Si no está tratando de volver a probar los teoremas conocidos, solo diría que es un teorema de límite central para RV independientes no distribuidos idénticamente pero con límites uniformes y lo llamaría un día. No tengo una buena fuente a mano, pero no debería ser muy difícil encontrar una, por ejemplo, mira /mathpro/29508/is-there-a-central-limit-theorem- for-bounded-non-idically-distributed-random .

Editar: Mi mal, por supuesto, la condición uniformemente limitada no es suficiente, también necesita

k=1nσk2
Adrien
fuente