Me pregunto si la desviación estándar siempre se basó en el supuesto de una distribución normal. En otras palabras, si la muestra no se distribuye normalmente, ¿debería considerarse un error utilizar la desviación estándar?
9
Me pregunto si la desviación estándar siempre se basó en el supuesto de una distribución normal. En otras palabras, si la muestra no se distribuye normalmente, ¿debería considerarse un error utilizar la desviación estándar?
Respuestas:
No. El uso de la desviación estándar no supone normalidad.
La varianza de una variable aleatoria se define como . Mientras exista la varianza, la desviación estándar también existe. La desviación estándar es la raíz cuadrada de la varianza.Var(X)=E[(X−E[X])2]
Puede usar la varianza o la desviación estándar en cualquier momento que existan. La variación surge en innumerables situaciones.Var(X)
Hay teoremas especiales, lemas, etc., aunque para el caso especial donde sigue la distribución normal.X
Un uso común de la desviación estándar que depende de la normalidad:
Si sigue la distribución normal, entonces hay aproximadamente un 95% de probabilidad de que se encuentre dentro de dos desviaciones estándar de la media.X X
Esa afirmación es cierta si sigue la distribución normal (y varias otras) pero no es cierta en general.X
Un uso común de la varianza que no depende de la normalidad:
Sea una variable aleatoria con media y varianza . Definir para como variables aleatorias independientes, cada uno después de la distribución idéntica como .X E[X]=μ Var(X)=σ2 Xi i=1,…,n X
Defina la media muestral basada en observaciones como:n
Según el Teorema del límite central, converge hacia una variable aleatoria normalmente distribuida con media y varianza . (Más precisamente, converge en distribución a como ).X¯n μ σ2n n−−√(X¯n−μ) N(0,σ2) n→∞
La implicación práctica es que la media de la muestra para grandes puede ser tratada como variable aleatoria distribuida normalmente cuya varianza es una función de la varianza de . (Recordar ) Y este resultado no requiere que sea normal. (Sin embargo, requiere una más baja para funcionar bien si está más cerca en cierto sentido de la distribución normal).X¯n n σ2n X Var(X)=σ2 X n X
El Teorema del límite central es una herramienta omnipresente que utiliza la varianza de y no necesita que siga la distribución normal.X X
fuente
En la configuración estándar de IID, en condiciones de regularidad adecuadas, (así como ) es un estimador muy consistente de . Esto se sigue directamente de la Ley Fuerte de Números Grandes. No se necesita un supuesto de modelo normal.σ 2 M L V un r [ X i ]S2 σ^2ML Var[Xi]
fuente