Una versión muy simple del teorema limitado central como se muestra a continuación que es Lindeberg – Lévy CLT. No entiendo por qué hay un en el lado izquierdo. Y Lyapunov CLT dice pero por qué no ? ¿Alguien me diría cuáles son estos factores, como y ? ¿Cómo los conseguimos en el teorema?√
1√
√ 1
central-limit-theorem
intuition
Cerdo volador
fuente
fuente
Respuestas:
Buena pregunta (+1) !!
Recordará que para las variables aleatorias independientes e , y . Entonces, la varianza de es , y la varianza de es .Y V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) V a r ( a ⋅ X ) = a 2 ⋅ V a r ( X ) ∑ n i = 1 X i ∑ n i = 1 σ 2 = n σ 2 ˉX Y Va r ( X+ Y) = Va r ( X) + Va r ( Y) Va r ( a ⋅ X) = a2⋅ Va r ( X) ∑nortei = 1Xyo ∑nortei = 1σ2= n σ2 nσ2/n2=σ2/nX¯= 1norte∑nortei = 1Xyo n σ2/ n2= σ2/ n
Esto es para la varianza . Para estandarizar una variable aleatoria, la divide por su desviación estándar. Como sabe, el valor esperado de es , por lo que la variable μX¯ μ
N(0,
Con respecto a su segundo punto, creo que la ecuación que se muestra arriba ilustra que debe dividir entre y no para estandarizar la ecuación, explicando por qué usa (el estimador de y no .√σ snσ) √σ--√ snorte σ) snorte--√
Adición: @whuber sugiere discutir el por qué del escalado por . Lo hace allí , pero como la respuesta es muy larga, intentaré captar el sentido de su argumento (que es una reconstrucción de los pensamientos de De Moivre).norte--√
Si agrega un gran número de + 1 y -1, puede aproximar la probabilidad de que la suma sea por conteo elemental. El registro de esta probabilidad es proporcional a . Entonces, si queremos que la probabilidad anterior converja a una constante a medida que aumenta, tenemos que usar un factor de normalización en .j - j 2 / n n O ( √norte j - j2/ n norte O ( n--√)
Usando herramientas matemáticas modernas (post de Moivre), puede ver la aproximación mencionada anteriormente al notar que la probabilidad buscada es
que aproximamos por la fórmula de Stirling
fuente
Existe una buena teoría sobre qué tipo de distribuciones pueden ser distribuciones limitantes de sumas de variables aleatorias. El buen recurso es el siguiente libro de Petrov, que personalmente disfruté inmensamente.
Resulta que si está investigando límites de este tipo donde son variables aleatorias independientes, las distribuciones de límites son solo ciertas distribuciones.X i
Hay muchas matemáticas dando vueltas entonces, lo que se traduce en varios teoremas que caracterizan completamente lo que sucede en el límite. Uno de esos teoremas se debe a Feller:
Teorema Sea una secuencia de variables aleatorias independientes, sea la función de distribución de , y sea una secuencia de constante positiva. Para queV n ( x ) X n a n{Xn;n=1,2,...} Vn(x) Xn an
y
es necesario y suficiente que
y
Este teorema te da una idea de cómo debería ser .unanorte
La teoría general en el libro está construida de tal manera que la constante de normas está restringida de alguna manera, pero los teoremas finales que dan las condiciones necesarias y suficientes no dejan espacio para la constante de normas distintas de .norte--√
fuente
s representa la desviación estándar de la muestra para la media muestral. s es la varianza muestral para la media muestral y es igual a S / n. Donde S es la estimación muestral de la varianza de la población. Dado que s = S / √n eso explica cómo aparece √n en la primera fórmula. Tenga en cuenta que habría un σ en el denominador si el límite fueran 2 n 2 n 2 n nnorte norte 2 norte 2 norte 2 norte norte
N (0,1) pero el límite se da como N (0, σ ). Como S es una estimación consistente de σ, se usa en la segunda ecuación para sacar σ del límite.n2 norte
fuente
Intuitivamente, si para algunos deberíamos esperar que sea aproximadamente igual a ; Parece una expectativa bastante razonable, aunque no creo que sea necesario en general. La razón de en la primera expresión es que la varianza de va a como y entonces está inflando la varianza para que la expresión solo tenga una varianza igual a . En la segunda expresión, el término se define comoσ 2 Var ( Z n ) σ 2 √Znorte→ N( 0 , σ2) σ2 Var ( Znorte) σ2 ˉ X n-μ0 1norte--√ X¯norte- μ 0 0 √1norte σ2sn √norte--√ σ2 snorte ∑ n i = 1 Var(Xi)1∑nortei = 1Var ( Xyo)-----------√ mientras que la varianza del numerador crece como , entonces nuevamente tenemos que la varianza de la expresión completa es una constante ( en este caso).∑nortei = 1Var ( Xyo) 1
Esencialmente, sabemos que algo "interesante" está sucediendo con la distribución de , pero si no lo adecuadamente, no podremos verlo. He escuchado que esto se describe a veces como la necesidad de ajustar el microscopio. Si no explotamos (por ejemplo) by entonces solo tenemos en distribución por la ley débil; Un resultado interesante en sí mismo pero no tan informativo como el CLT. Si inflamos por algún factor que está dominado por , todavía obtenemos mientras que cualquier factor que domina ˉ X -μ√X¯norte: = 1norte∑yoXyo X¯- μ ˉ X n-μ→0an √norte--√ X¯norte- μ → 0 unanorte an( ˉ X n-μ)→0an √norte--√ unanorte( X¯norte- μ ) → 0 unanorte an( ˉ X n-μ)→∞ √norte--√ da . Resulta que es el aumento correcto para poder ver lo que está sucediendo en este caso (nota: toda la convergencia aquí está en distribución; hay otro nivel de aumento que es interesante para una convergencia casi segura, lo que da lugar a a la ley del logaritmo iterado).unanorte( X¯norte- μ ) → ∞ norte--√
fuente