¿Hay algún ejemplo de dónde no se cumple el teorema del límite central?

32

Wikipedia dice:

En la teoría de la probabilidad, el teorema del límite central (CLT) establece que, en la mayoría de las situaciones , cuando se agregan variables aleatorias independientes, su suma correctamente normalizada tiende hacia una distribución normal (informalmente una "curva de campana") incluso si las variables originales no son Normalmente distribuido...

Cuando dice "en la mayoría de las situaciones", ¿en qué situaciones no funciona el teorema del límite central?

Ryan McCauley
fuente

Respuestas:

33

Para comprender esto, primero debe establecer una versión del Teorema del límite central. Aquí está la declaración "típica" del teorema del límite central:

Lindeberg – Lévy CLT. Suponga que es una secuencia de variables aleatorias iid con y . Deje . Luego, cuando aproxima al infinito, las variables aleatorias convergen en distribución a un normal es decir E[ X i ]=μVar[ X i ]= σ 2 < S n := X 1 + + X nX1,X2,E[Xi]=μVar[Xi]=σ2< nSn:=X1++XnnnN(0,σ2)n(Snμ)N(0,σ2)

n((1ni=1nXi)μ) d N(0,σ2).

Entonces, ¿cómo difiere esto de la descripción informal y cuáles son las brechas? Existen varias diferencias entre su descripción informal y esta descripción, algunas de las cuales se han discutido en otras respuestas, pero no completamente. Entonces, podemos convertir esto en tres preguntas específicas:

  • ¿Qué sucede si las variables no están distribuidas de manera idéntica?
  • ¿Qué pasa si las variables tienen varianza infinita o media infinita?
  • ¿Qué tan importante es la independencia?

Tomando estos uno a la vez,

No distribuido de manera idéntica , los mejores resultados generales son las versiones de Lindeberg y Lyaponov del teorema del límite central. Básicamente, siempre que las desviaciones estándar no crezcan demasiado, puede obtener un teorema de límite central decente.

Lyapunov CLT. [5] Supongamos que es una secuencia de variables aleatorias independientes, cada una con un valor esperado finito y varianza Definir:μ i σ 2 s 2 n =nX1,X2,μiσ2sn2=i=1nσi2

Si para algún , la condición de Lyapunov se cumple, luego se suma una suma de converge en distribución a una variable aleatoria normal estándar, ya que n va al infinito:lim n 1δ>0Xi-μi/snlimn1sn2+δi=1nE[|Xiμi|2+δ]=0Xiμi/sn

1sni=1n(Xiμi) d N(0,1).

Existen teoremas de varianza infinita similares al teorema del límite central para variables con varianza infinita, pero las condiciones son significativamente más estrechas que para el teorema del límite central habitual. Esencialmente, la cola de la distribución de probabilidad debe ser asintótica a para . En este caso, los sumandos escalados apropiados convergen a una distribución estable Levy-Alpha . 0<α<2|x|α10<α<2

Importancia de la independencia Hay muchos teoremas de límite central diferentes para secuencias no independientes de . Todos son altamente contextuales. Como Batman señala, hay uno para Martingales. Esta pregunta es un área de investigación en curso, con muchas, muchas variaciones diferentes dependiendo del contexto específico de interés. Esta pregunta sobre Math Exchange es otra publicación relacionada con esta pregunta.Xi

John
fuente
2
He eliminado un ">" perdido de una fórmula que creo que se ha introducido debido al sistema de citas. ¡No dude en revertir mi edición si fue intencional!
Silverfish
Una matriz CLT triangular es probablemente una CLT más representativa que la indicada. En cuanto a no independiente, los CLT de martingala son un caso razonablemente utilizado.
Batman
@ Batman, ¿cuál es un ejemplo de un CLT de matriz triangular? Siéntase libre de editar mi respuesta, para agregarla. No estoy familiarizado con eso.
John
Algo así como seg. 4.2.3 en personal.psu.edu/drh20/asymp/lectures/p93to100.pdf
Batman
1
"siempre y cuando las desviaciones estándar no crezcan demasiado" o se reduzcan (p. ej .:σi2=σi12/2
2/2
21

Aunque estoy bastante seguro de que se ha respondido antes, aquí hay otro:

Existen varias versiones del teorema del límite central, la más general es que, dadas las funciones arbitrarias de densidad de probabilidad, la suma de las variables se distribuirá normalmente con un valor medio igual a la suma de los valores medios, y la varianza será la suma de las variaciones individuales.

Una restricción muy importante y relevante es que la media y la varianza de los archivos PDF dados deben existir y deben ser finitas.

Entonces, solo tome cualquier pdf sin valor medio o varianza, y el teorema del límite central ya no se mantendrá. Así que tome una distribución lorentziana por ejemplo.

querubín
fuente
+1 O toma una distribución con una varianza infinita, como la distribución de una caminata aleatoria.
Alexis
2
@Alexis: suponiendo que esté mirando una caminata aleatoria en un punto finito en el tiempo, habría pensado que tendría una variación finita, que es la suma de iid pasos cada uno con variación finitan
Henry
1
@Henry: No, no estoy asumiendo en un punto en el tiempo, sino la variación de la distribución de todos los posibles recorridos aleatorios de longitudes infinitas.
Alexis
1
@Alexis Si cada paso de la caminata aleatoria es o iid con igual probabilidad y las posiciones son entonces el Teorema del límite central implica correctamente que como tienes la distribución de convergente en distribución a + 1 - 1 Y n = Xi+11nYn=1nXin N(0,1)n(1nYn)=YnnN(0,1)
Henry
1
@Alexis no importa para el CLT, porque cada distribución individual todavía tiene una variación finita.
Cubic
15

No, CLT siempre se cumple cuando se cumplen sus supuestos. Las calificaciones como "en la mayoría de las situaciones" son referencias informales a las condiciones bajo las cuales se debe aplicar CLT.

Por ejemplo, una combinación lineal de variables independientes de la distribución de Cauchy no se sumará a la variable distribuida Normal . Una de las razones es que la varianza no está definida para la distribución de Cauchy , mientras que CLT pone ciertas condiciones en la varianza, por ejemplo, que tiene que ser finita. Una implicación interesante es que, dado que las simulaciones de Monte Carlo están motivadas por CLT, debe tener cuidado con las simulaciones de Monte Carlo cuando se trata de distribuciones de cola gruesa, como Cauchy.

Tenga en cuenta que hay una versión generalizada de CLT. Funciona para variaciones infinitas o indefinidas, como la distribución de Cauchy. A diferencia de muchas distribuciones que se comportan bien, la suma correctamente normalizada de los números de Cauchy sigue siendo Cauchy. No converge al gaussiano.

Por cierto, no solo Gaussian, sino muchas otras distribuciones tienen PDF en forma de campana, por ejemplo, Student t. Es por eso que la descripción que citó es bastante liberal e imprecisa, tal vez a propósito.

Aksakal
fuente
7

n

nn=10001/2π0.4

ingrese la descripción de la imagen aquí

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")
Christoph Hanck
fuente
3
t30.416π0.231
Ese es un buen punto, uno podría estandarizar la media sd(x)para obtener algo que, si el CLT funciona, converge por el teorema de Slutzky, a una variante N (0,1). Quería mantener el ejemplo simple, pero, por supuesto, tienes razón.
Christoph Hanck
6

Un caso simple donde el CLT no puede sostenerse por razones muy prácticas, es cuando la secuencia de variables aleatorias se acerca estrictamente a su límite de probabilidad desde un lado . Esto se encuentra, por ejemplo, en estimadores que estiman algo que se encuentra en un límite.

θU(0,θ)θθθ

El estimador debidamente escalado tiene una distribución limitante, pero no de la "variedad CLT".

Alecos Papadopoulos
fuente
3

Puede encontrar una solución rápida aquí.

Surgen excepciones al teorema del límite central

  1. Cuando hay varios máximos de la misma altura, y
  2. Donde la segunda derivada se desvanece al máximo.

Hay ciertas otras excepciones que se describen en la respuesta de @cherub.


La misma pregunta ya se ha hecho en math.stackexchange . Puedes consultar las respuestas allí.

Ferdi
fuente
55
Por "maxima", ¿te refieres a modos? Ser bimodal no tiene nada que ver con no satisfacer a CLT.
Acumulación
M(z)=n=P(X=n)zn
@AlexR. La respuesta no tiene ningún sentido sin leer el enlace, y está lejos de ser clara incluso con el enlace. Me inclino hacia el voto negativo como algo peor que una respuesta de solo enlace.
Acumulación