¿Cuál es la importancia de la función

19

En mi clase de cálculo, encontramos la función , o la "curva de campana", y me dijeron que tiene aplicaciones frecuentes en estadística.ex2

Por curiosidad, quiero preguntar: ¿Es la función realmente importante en las estadísticas? Si es así, ¿de qué se trata que lo hace útil, y cuáles son algunas de sus aplicaciones? e - x 2ex2mi-X2

No pude encontrar mucha información sobre la función en Internet, pero después de investigar un poco, encontré un vínculo entre las curvas de campana en general y algo llamado distribución normal . Una página de Wikipedia vincula estos tipos de funciones a la aplicación de estadísticas, destacando por mí, que dice:

"La distribución normal se considera la distribución de probabilidad más prominente en las estadísticas. Hay varias razones para esto: 1 Primero, la distribución normal surge del teorema del límite central, que establece que, en condiciones moderadas, se obtiene la suma de una gran cantidad de variables aleatorias de la misma distribución se distribuye aproximadamente normalmente, independientemente de la forma de la distribución original ".

Entonces, si reúno una gran cantidad de datos de algún tipo de encuesta o similar, ¿podrían distribuirse equitativamente entre una función como ? La función es simétrica, también lo es su simetría, es decir, su utilidad para la distribución normal, ¿qué la hace tan útil en estadística? Solo estoy especulando.mi-X2

En general, ¿qué hace que útil en estadísticas? Si la distribución normal es la única área, entonces, ¿qué hace que único o específicamente útil entre otras funciones de tipo gaussiano en distribución normal? e - x 2mi-X2mi-X2

Zolani13
fuente
Bueno para empezar eso debería leer "significa" no "suma".
Tristan
2
La suma también. Después de todo, es solo la media multiplicada por el número de muestras.
Erik
1
La cita muestra que las palabras clave para una búsqueda incluyen "distribución normal". Al realizar esa búsqueda aquí se encuentran más de 600 hilos, un promedio de uno por día desde que comenzó este sitio. Un poco de tiempo leyendo estos éxitos ayudará rápidamente a cualquiera a apreciar el papel de la "curva de campana" en las estadísticas.
whuber
44
Del hilo más votado relacionado con las distribuciones normales : "Todo el mundo cree en la ley exponencial de los errores [es decir, la distribución Normal]: los experimentadores, porque creen que las matemáticas pueden probarlo, y los matemáticos, porque creen que tiene establecido por observación ".
whuber
Vea las respuestas a mi pregunta "¿Cuáles son las caracterizaciones más sorprendentes de la distribución gaussiana" stats.stackexchange.com/questions/4364/…
robin girard

Respuestas:

12

La razón por la que esta función es importante es, de hecho, la distribución normal y su compañero estrechamente vinculado, el teorema del límite central (tenemos algunas buenas explicaciones del CLT en otras preguntas aquí).

En estadística, el CLT generalmente se puede usar para calcular las probabilidades aproximadamente, haciendo declaraciones como "estamos 95% seguros de que ..." posible (el significado de "95% seguro" a menudo se entiende mal, pero eso es un asunto diferente).

La función es (una versión a escala de) la función de densidad de la distribución normal. Si se puede modelar una cantidad aleatoria utilizando la distribución normal, esta función describe la probabilidad de que sean diferentes los valores posibles de dicha cantidad. Los resultados en regiones con alta densidad son más probables que los resultados en regiones con baja densidad.Exp(-(X-μ)22σ2)

y σ son parámetros que determinan la ubicación y la escala de la función de densidad. Es simétrico respecto a μ , por lo que cambiar μ significa que desplaza la función hacia la derecha o hacia la izquierda. σ determina el valor de la función de densidad en su máximo ( x = μ ) y qué tan rápido va a 0 cuando x se aleja de μ . En ese sentido, cambiarcambia la escala de la función.μσμμσX=μXμσ

Para la elección particular y la densidad es (proporcional a) . Esta no es una opción particularmente interesante de estos parámetros, pero tiene el beneficio de producir una función de densidad que parece un poco más simple que todas las demás.σ = 1 / μ=0 0 e - x 2σ=1/ /2mi-X2

Por otro lado, podemos pasar de a cualquier otra densidad normal mediante el cambio de variables . La razón por la cual su libro de texto dice que , y no , es una muy La función importante es que es más simple de escribir. x = u - μmi-X2e-x2exp(-(x-μ)2X=tu-μ2σmi-X2e-x2exp((xμ)22σ2)ex2

MånsT
fuente
1
(+1) Primera oración del penúltimo párrafo: podría decir que es proporcional a en lugar de is .
cardenal
@cardinal: ¡Gracias, tienes toda la razón! Edité la respuesta.
MånsT
1
+1, me gusta mucho esta respuesta. Una cosa que vale la pena señalar es que el pdf de lo normal generalmente se escribe con al frente. La razón es que el área total debajo de la curva es igual a , pero dado que un uso típico del pdf es determinar las probabilidades (que suman 1), es conveniente para el área debajo de la curva para igualar 1, y así dividimos por el total para lograr ese resultado. Creo que tienes razón en que esto se ha omitido por su apariencia más simple. 12πσ22πσ2
gung - Restablece a Monica
3

Tiene razón, la distribución normal o gaussiana es una escalada y desplazada , por lo que la importancia de proviene principalmente del hecho de que es esencialmente la distribución normal.exp ( - x 2 )exp(x2)exp(x2)

Y la distribución normal es importante principalmente porque ("en condiciones de regularidad moderada") la suma de muchas variables aleatorias independientes e idénticamente distribuidas se aproxima a la normal, cuando "muchas" se acerca al infinito.

No todo se distribuye normalmente. Por ejemplo, los resultados de su encuesta pueden no ser, al menos si las respuestas ni siquiera están en la escala continua, sino algo así como los enteros 1–5. Pero la media de los resultados normalmente se distribuye en muestras repetidas, porque la media es solo una suma escalada (normalizada) y las respuestas individuales son independientes entre sí. Suponiendo que la muestra es lo suficientemente grande, por supuesto, porque estrictamente hablando, la normalidad aparece solo cuando el tamaño de la muestra se vuelve infinito.

Como puede ver en el ejemplo, la distribución normal puede aparecer como resultado del proceso de estimación o modelado, incluso cuando los datos no se distribuyen normalmente. Por lo tanto, las distribuciones normales están en todas partes en las estadísticas. En las estadísticas bayesianas, muchas distribuciones posteriores de parámetros son aproximadamente normales, o se puede suponer que lo son.

scellus
fuente
Re: "la distribución normal o gaussiana es una exp escalada y desplazada (-x ^ 2), por lo que la importancia de exp (-x ^ 2) proviene principalmente del hecho de que es esencialmente la distribución normal". - La densidad de probabilidad de la distribución normal es una función guasiana. La distribución normal en sí misma no es sinónimo de , como parece indicar este comentario. ex2
Macro
No son sinónimos, gracias por señalar esto. (Mi intención no era ser preciso, simplemente comprensible para un no estadístico. Ya hay una buena respuesta precisa.)
scellus
-1

n01/nn

Michael R. Chernick
fuente
Se ha creado una sala de chat para comentarios a esta pregunta en chat.stackexchange.com/rooms/3720/… . He eliminado todos los comentarios (¡50!) Y he bloqueado esta publicación para evitar nuevos abusos del mecanismo de comentarios.
whuber