( Publicado originalmente en MSE).
He visto muchas discusiones heurísticas del teorema clásico del límite central que hablan de la distribución normal (o cualquiera de las distribuciones estables) como un "atractor" en el espacio de las densidades de probabilidad. Por ejemplo, considere estas oraciones en la parte superior del tratamiento de Wikipedia :
En un uso más general, un teorema de límite central es cualquiera de un conjunto de teoremas de convergencia débil en la teoría de probabilidad. Todos expresan el hecho de que una suma de muchas variables aleatorias independientes e idénticamente distribuidas (iid), o alternativamente, variables aleatorias con tipos específicos de dependencia, tenderán a distribuirse de acuerdo con uno de un pequeño conjunto de distribuciones de atractores . Cuando la varianza de las variables iid es finita, la distribución del atractor es la distribución normal.
Este lenguaje de sistemas dinámicos es muy sugerente. Feller también habla de "atracción" en su tratamiento del CLT en su segundo volumen (me pregunto si esa es la fuente del lenguaje), y Yuval Flimus en esta nota incluso habla de la "cuenca de la atracción". (No creo que él realmente signifique "la forma exacta de la cuenca de atracción es deducible de antemano", sino más bien "la forma exacta del atractor es deducible de antemano"; aún así, el lenguaje está ahí). Mi pregunta es: ¿ pueden estos ¿Se precisan analogías dinámicas?No conozco un libro en el que se encuentren, aunque muchos libros enfatizan que la distribución normal es especial por su estabilidad bajo convolución (así como su estabilidad bajo la transformada de Fourier). Esto básicamente nos dice que lo normal es importante porque es un punto fijo. El CLT va más allá y nos dice que no es solo un punto fijo, sino un atractor.
Para hacer que esta imagen geométrica sea precisa, imagino que el espacio de fase es un espacio de función de dimensión infinita adecuado (el espacio de densidades de probabilidad) y el operador de evolución se repite convolución con una condición inicial. Pero no tengo idea de los tecnicismos involucrados en hacer que esta imagen funcione o si vale la pena seguirla.
Supongo que, dado que no puedo encontrar un tratamiento que siga este enfoque explícitamente, debe haber algo mal con mi sensación de que se puede hacer o que sería interesante. Si ese es el caso, me gustaría saber por qué.
EDITAR : Hay tres preguntas similares en Math Stack Exchange y MathOverflow en las que los lectores pueden estar interesados:
fuente
Respuestas:
Después de investigar un poco en la literatura, alentado por la respuesta de Kjetil, he encontrado algunas referencias que toman en serio el enfoque de sistemas geométricos / dinámicos para el CLT, además del libro de Y. Sinai. Estoy publicando lo que he encontrado para otras personas que puedan estar interesadas, pero aún espero escuchar de un experto sobre el valor de este punto de vista.
La influencia más significativa parece provenir del trabajo de Charles Stein. Pero la respuesta más directa a mi pregunta parece ser de Hamedani y Walter, quienes ponen una métrica en el espacio de las funciones de distribución y muestran que la convolución genera una contracción, que produce la distribución normal como el único punto fijo.
AGREGADO el 19 de octubre de 2018.
Otra fuente para este punto de vista es la Probabilidad de Oliver Knill y los Procesos estocásticos con aplicaciones , pág. 11 (énfasis agregado):
fuente
El texto "Teoría de la probabilidad un curso introductorio" de Y Sinai (Springer) analiza el CLT de esta manera.
http://www.springer.com/us/book/9783662028452
La idea es (de memoria ...) que
1) La distribución normal maximiza la entropía (entre distribuciones con varianza fija) 2) El operador de promedioA ( x1, x2) = x1+ x22√ mantiene la varianza y aumenta la entropía ... y el resto es técnica. Entonces, obtienes la configuración de sistemas dinámicos de iteración de un operador.
fuente