Para comprender esto, primero debe establecer una versión del Teorema del límite central. Aquí está la declaración "típica" del teorema del límite central:
Lindeberg – Lévy CLT. Suponga que es una secuencia de variables aleatorias iid con y . Deje . Luego, cuando
aproxima al infinito, las variables aleatorias convergen en distribución a un normal es decir E[ X i ]=μVar[ X i ]= σ 2 <∞ S n := X 1 + ⋯ + X nX1, X2, ...mi[ Xyo] = μVa r [ Xyo] = σ2< ∞ n√Snorte:=X1+⋯+XnnnN(0,σ2)n−−√(Sn−μ)N(0,σ2)
norte--√( ( 1norte∑i = 1norteXyo) -μ ) →re norte( 0 , σ2) .
Entonces, ¿cómo difiere esto de la descripción informal y cuáles son las brechas? Existen varias diferencias entre su descripción informal y esta descripción, algunas de las cuales se han discutido en otras respuestas, pero no completamente. Entonces, podemos convertir esto en tres preguntas específicas:
- ¿Qué sucede si las variables no están distribuidas de manera idéntica?
- ¿Qué pasa si las variables tienen varianza infinita o media infinita?
- ¿Qué tan importante es la independencia?
Tomando estos uno a la vez,
No distribuido de manera idéntica , los mejores resultados generales son las versiones de Lindeberg y Lyaponov del teorema del límite central. Básicamente, siempre que las desviaciones estándar no crezcan demasiado, puede obtener un teorema de límite central decente.
Lyapunov CLT. [5] Supongamos que es una secuencia de variables aleatorias independientes, cada una con un valor esperado finito y varianza
Definir:μ i σ 2 s 2 n = ∑ nX1,X2, ...μyoσ2s2norte= ∑nortei = 1σ2yo
Si para algún , la condición de Lyapunov
se cumple, luego se suma una suma de converge en distribución a una variable aleatoria normal estándar, ya que n va al infinito:lim n → ∞ 1δ> 0Xi-μi/snlimn → ∞1s2 + δnorte∑i = 1nortemi[ | Xyo- μyoEl |2 + δ] =0Xyo- μyo/ snorte
1snorte∑nortei = 1( Xyo- μyo) → re norte( 0 , 1 ) .
Existen teoremas de varianza infinita similares al teorema del límite central para variables con varianza infinita, pero las condiciones son significativamente más estrechas que para el teorema del límite central habitual. Esencialmente, la cola de la distribución de probabilidad debe ser asintótica a para . En este caso, los sumandos escalados apropiados convergen a una distribución estable Levy-Alpha . 0<α<2El | x |- α - 10 < α < 2
Importancia de la independencia Hay muchos teoremas de límite central diferentes para secuencias no independientes de . Todos son altamente contextuales. Como Batman señala, hay uno para Martingales. Esta pregunta es un área de investigación en curso, con muchas, muchas variaciones diferentes dependiendo del contexto específico de interés. Esta pregunta sobre Math Exchange es otra publicación relacionada con esta pregunta.Xyo
Aunque estoy bastante seguro de que se ha respondido antes, aquí hay otro:
Existen varias versiones del teorema del límite central, la más general es que, dadas las funciones arbitrarias de densidad de probabilidad, la suma de las variables se distribuirá normalmente con un valor medio igual a la suma de los valores medios, y la varianza será la suma de las variaciones individuales.
Una restricción muy importante y relevante es que la media y la varianza de los archivos PDF dados deben existir y deben ser finitas.
Entonces, solo tome cualquier pdf sin valor medio o varianza, y el teorema del límite central ya no se mantendrá. Así que tome una distribución lorentziana por ejemplo.
fuente
No, CLT siempre se cumple cuando se cumplen sus supuestos. Las calificaciones como "en la mayoría de las situaciones" son referencias informales a las condiciones bajo las cuales se debe aplicar CLT.
Por ejemplo, una combinación lineal de variables independientes de la distribución de Cauchy no se sumará a la variable distribuida Normal . Una de las razones es que la varianza no está definida para la distribución de Cauchy , mientras que CLT pone ciertas condiciones en la varianza, por ejemplo, que tiene que ser finita. Una implicación interesante es que, dado que las simulaciones de Monte Carlo están motivadas por CLT, debe tener cuidado con las simulaciones de Monte Carlo cuando se trata de distribuciones de cola gruesa, como Cauchy.
Tenga en cuenta que hay una versión generalizada de CLT. Funciona para variaciones infinitas o indefinidas, como la distribución de Cauchy. A diferencia de muchas distribuciones que se comportan bien, la suma correctamente normalizada de los números de Cauchy sigue siendo Cauchy. No converge al gaussiano.
Por cierto, no solo Gaussian, sino muchas otras distribuciones tienen PDF en forma de campana, por ejemplo, Student t. Es por eso que la descripción que citó es bastante liberal e imprecisa, tal vez a propósito.
fuente
fuente
sd(x)
para obtener algo que, si el CLT funciona, converge por el teorema de Slutzky, a una variante N (0,1). Quería mantener el ejemplo simple, pero, por supuesto, tienes razón.Un caso simple donde el CLT no puede sostenerse por razones muy prácticas, es cuando la secuencia de variables aleatorias se acerca estrictamente a su límite de probabilidad desde un lado . Esto se encuentra, por ejemplo, en estimadores que estiman algo que se encuentra en un límite.
El estimador debidamente escalado tiene una distribución limitante, pero no de la "variedad CLT".
fuente
Puede encontrar una solución rápida aquí.
Surgen excepciones al teorema del límite central
Hay ciertas otras excepciones que se describen en la respuesta de @cherub.
La misma pregunta ya se ha hecho en math.stackexchange . Puedes consultar las respuestas allí.
fuente