En una distribución normal, la regla 68-95-99.7 imparte mucho significado a la desviación estándar, pero ¿qué significaría la desviación estándar en una distribución no normal (multimodal o sesgada)? ¿Todos los valores de datos seguirían dentro de 3 desviaciones estándar? ¿Tenemos reglas como la 68-95-99.7 para distribuciones no normales?
normal-distribution
standard-deviation
skewness
Zuhaib Ali
fuente
fuente
Respuestas:
La desviación estándar es una medida particular de la variación. Hay varios otros, la desviación absoluta media es bastante popular. La desviación estándar no es de ninguna manera especial. Lo que lo hace parecer especial es que la distribución gaussiana es especial.
Como se señala en los comentarios, la desigualdad de Chebyshev es útil para tener un sentimiento. Sin embargo hay más .
fuente
Es la raíz cuadrada del segundo momento central , la varianza. Los momentos están relacionados con funciones características (CF), que se denominan características por la razón de que definen la distribución de probabilidad. Entonces, si conoce todos los momentos, conoce CF; por lo tanto, conoce toda la distribución de probabilidad.
La función característica de la distribución normal se define por solo dos momentos: la media y la varianza (o desviación estándar). Por lo tanto, para una distribución normal, la desviación estándar es especialmente importante, es el 50% de su definición de alguna manera.
Para otras distribuciones, la desviación estándar es de alguna manera menos importante porque tienen otros momentos. Sin embargo, para muchas distribuciones utilizadas en la práctica, los primeros momentos son los más grandes, por lo que son los más importantes para saber.
Ahora, intuitivamente, la media le dice dónde está el centro de su distribución, mientras que la desviación estándar le dice qué tan cerca de este centro están sus datos.
Como la desviación estándar está en las unidades de la variable, también se usa para escalar otros momentos para obtener medidas como la curtosis . La curtosis es una métrica adimensional que le indica qué tan gordas son las colas de su distribución en comparación con lo normal
fuente
La desviación estándar de la muestra es una medida de la desviación de los valores observados de la media, en las mismas unidades para medir los datos. Distribución normal, o no.
fuente