La distribución normal parece poco intuitiva hasta que aprende el CLT, lo que explica por qué es tan frecuente en la vida real. Pero, ¿surge alguna vez como la distribución "natural" de alguna cantidad?
normal-distribution
central-limit-theorem
cabeza de jardín
fuente
fuente
Respuestas:
Hasta cierto punto, creo que esto puede ser un problema filosófico tanto como uno estadístico.
Muchos fenómenos naturales se distribuyen aproximadamente de manera normal. Uno puede discutir si la causa subyacente de eso puede ser algo así como el CLT:
Las alturas de las personas pueden considerarse como la suma de muchas causas más pequeñas (tal vez independientes, improbablemente distribuidas de manera idéntica): longitudes de varios huesos, o resultados de diversas expresiones genéticas, o resultados de muchas influencias dietéticas, o alguna combinación de todo lo anterior .
Los puntajes de los exámenes se pueden considerar como las sumas de puntajes en muchas preguntas de exámenes individuales (posiblemente distribuidas de manera idéntica, improbablemente completamente independientes).
Distancia que recorre una partícula en una dimensión como resultado del movimiento browniano en un fluido: el movimiento se puede considerar de manera abstracta como una caminata aleatoria resultante de los golpes aleatorios del IID de las moléculas.
Un ejemplo en el que el CLT no está necesariamente involucrado es la dispersión de disparos alrededor del ojo de un toro: la distancia desde el ojo del toro se puede modelar como una distribución de Rayleigh (proporcional a la raíz cuadrada de chi-sq con 2 DF) y el ángulo en sentido antihorario desde El eje horizontal positivo se puede modelar como uniforme enLuego, después de cambiar de coordenadas polares a rectangulares, las distancias en direcciones horizontal (x) e vertical (y) resultan ser bivariadas normales sin correlación. [Esta es la esencia de la transformación Box-Muller, que puedes buscar en Google.] Sin embargo, las coordenadas xey normales podrían considerarse como la suma de muchas pequeñas inexactitudes en la focalización, lo que podría justificar un mecanismo relacionado con CLT en el fondo. .(0,2π).
En un sentido histórico, el uso generalizado de distribuciones normales (gaussianas) en lugar de distribuciones doble exponenciales (Laplace) para modelar observaciones astronómicas puede deberse en parte al CLT. En los primeros días de errores de modelado de tales observaciones, hubo un debate entre Gauss y Laplace , cada uno argumentando por su propia distribución favorita. Por varias razones, el modelo normal ha ganado. Se puede argumentar que una razón para el éxito eventual de la distribución normal fue la conveniencia matemática basada en los límites normales de la CLT. Esto parece ser cierto incluso cuando no está claro qué familia de distribuciones proporciona el mejor ajuste. (Incluso ahora, todavía hay astrónomos que sienten que "la mejor observación"hecho por un astrónomo meticuloso y respetado seguramente tendrá un mejor valor que el promedio de muchas observaciones hechas por presumiblemente observadores menos talentosos. En efecto, preferirían ninguna intervención por parte de los estadísticos).
fuente
Muchas variables naturales se distribuyen normalmente. Alturas de los humanos? Tamaño de las colonias de animales?
fuente
rnorm(1)
. Lo mismo con todas las distribuciones, que no sean multinomiales.