¿Hay algún ejemplo de una variable que se distribuye normalmente que no sea * debido al Teorema del límite central?

11

La distribución normal parece poco intuitiva hasta que aprende el CLT, lo que explica por qué es tan frecuente en la vida real. Pero, ¿surge alguna vez como la distribución "natural" de alguna cantidad?

cabeza de jardín
fuente
44
La teoría física de la difusión, en la medida en que sea aplicable a cualquier sistema, predice distribuciones normales de cantidades (como temperatura o concentración) que se originan en un punto. De hecho, muchos sistemas son difusivos (precios de opciones, transporte de partículas en medios homogéneos, etc.), lo que sugiere que los ejemplos son abundantes, suponiendo que uno no sea tan ingenuo como para suponer que una distribución normal debe mantenerse exactamente a valores irrealmente grandes o pequeños. Eso sería un malentendido de toda teoría física.
whuber
2
La distribución normal parece poco intuitiva hasta que aprenda que maximiza la entropía bajo la restricción de la varianza fija.
leonbloy

Respuestas:

11

Hasta cierto punto, creo que esto puede ser un problema filosófico tanto como uno estadístico.

Muchos fenómenos naturales se distribuyen aproximadamente de manera normal. Uno puede discutir si la causa subyacente de eso puede ser algo así como el CLT:

  • Las alturas de las personas pueden considerarse como la suma de muchas causas más pequeñas (tal vez independientes, improbablemente distribuidas de manera idéntica): longitudes de varios huesos, o resultados de diversas expresiones genéticas, o resultados de muchas influencias dietéticas, o alguna combinación de todo lo anterior .

  • Los puntajes de los exámenes se pueden considerar como las sumas de puntajes en muchas preguntas de exámenes individuales (posiblemente distribuidas de manera idéntica, improbablemente completamente independientes).

  • Distancia que recorre una partícula en una dimensión como resultado del movimiento browniano en un fluido: el movimiento se puede considerar de manera abstracta como una caminata aleatoria resultante de los golpes aleatorios del IID de las moléculas.

Un ejemplo en el que el CLT no está necesariamente involucrado es la dispersión de disparos alrededor del ojo de un toro: la distancia desde el ojo del toro se puede modelar como una distribución de Rayleigh (proporcional a la raíz cuadrada de chi-sq con 2 DF) y el ángulo en sentido antihorario desde El eje horizontal positivo se puede modelar como uniforme enLuego, después de cambiar de coordenadas polares a rectangulares, las distancias en direcciones horizontal (x) e vertical (y) resultan ser bivariadas normales sin correlación. [Esta es la esencia de la transformación Box-Muller, que puedes buscar en Google.] Sin embargo, las coordenadas xey normales podrían considerarse como la suma de muchas pequeñas inexactitudes en la focalización, lo que podría justificar un mecanismo relacionado con CLT en el fondo. .(0,2π).

En un sentido histórico, el uso generalizado de distribuciones normales (gaussianas) en lugar de distribuciones doble exponenciales (Laplace) para modelar observaciones astronómicas puede deberse en parte al CLT. En los primeros días de errores de modelado de tales observaciones, hubo un debate entre Gauss y Laplace , cada uno argumentando por su propia distribución favorita. Por varias razones, el modelo normal ha ganado. Se puede argumentar que una razón para el éxito eventual de la distribución normal fue la conveniencia matemática basada en los límites normales de la CLT. Esto parece ser cierto incluso cuando no está claro qué familia de distribuciones proporciona el mejor ajuste. (Incluso ahora, todavía hay astrónomos que sienten que "la mejor observación"hecho por un astrónomo meticuloso y respetado seguramente tendrá un mejor valor que el promedio de muchas observaciones hechas por presumiblemente observadores menos talentosos. En efecto, preferirían ninguna intervención por parte de los estadísticos).

BruceET
fuente
Sí. Aún arreglando errores tipográficos. Gracias por notar esto. El mismo error en 'puntajes de prueba' también se corrigió.
BruceET
-3

Muchas variables naturales se distribuyen normalmente. Alturas de los humanos? Tamaño de las colonias de animales?

Feliz
fuente
1
@Happy En realidad, ninguno de los ejemplos dados aquí se distribuye normalmente porque el soporte de la distribución normal es -infinito a + infinito y los ejemplos dados nunca pueden ser cero o menos. En cada caso, la distribución normal podría ser una aproximación útil, pero no si estuviera interesado en las colas de la distribución.
JeremyC
2
La altura humana es el resultado de la suma de genes (aproximadamente) independientes, por lo que en realidad se deben a la CLT.
cabeza de jardín
2
@ArtemMavrin: obtener una altura negativa sería algo así como más de 8 desviaciones estándar. Si uno objeta que una aproximación normal no sea válida porque coloca una masa de probabilidad cero más allá de 8 sd, también podría quejarse de que un valor verdaderamente distribuido normalmente es irracional con probabilidad 1, sin embargo, todas nuestras mediciones son números racionales.
Cliff AB
1
@ArtemMavrin: bueno, si la pregunta es algo exactamente distribuido normalmente, esa respuesta es simple: no. Ni siquiera rnorm(1). Lo mismo con todas las distribuciones, que no sean multinomiales.
Cliff AB
2
@gardenhead tiene una lectura de la declaración del teorema del límite central y observa dónde no coincide con lo que dijiste (el número de genes es finito, mientras que CLT trata sobre la distribución limitante de una suma estandarizada como . (Por a propósito, hay otro teorema que dice que una suma finita de variables aleatorias iid no normales no puede ser normal; este teorema no se contradice con la CLT real)!n
Glen_b -Reinstate Mónica