¿Qué nos dice la desviación estándar en una distribución no normal?

40

En una distribución normal, la regla 68-95-99.7 imparte mucho significado a la desviación estándar, pero ¿qué significaría la desviación estándar en una distribución no normal (multimodal o sesgada)? ¿Todos los valores de datos seguirían dentro de 3 desviaciones estándar? ¿Tenemos reglas como la 68-95-99.7 para distribuciones no normales?

Zuhaib Ali
fuente
16
Echa un vistazo a la desigualdad de Chebyshev .
COOLSerdash
@COOLSerdash genial. Esto responde perfectamente a mi pregunta.
Zuhaib Ali
3
El punto de @ COOLSerdash está en el objetivo aquí, pero tenga en cuenta que la declaración estándar de la desigualdad de Chebyshev se refiere a la verdadera SD conocida a priori, no una SD estimada a partir de su muestra. Puede ser útil leer este excelente hilo de CV: ¿Existe una versión de muestra de la desigualdad unilateral de Chebeshev?
gung - Restablecer Monica
Además, probablemente no debería conformarse con Chebyshev de inmediato, probablemente puede hacerlo mucho mejor, sesgado o no.
Steve S
1
@gung también lo hace la regla 68-95-99.7!
Glen_b -Reinstate Monica

Respuestas:

12

La desviación estándar es una medida particular de la variación. Hay varios otros, la desviación absoluta media es bastante popular. La desviación estándar no es de ninguna manera especial. Lo que lo hace parecer especial es que la distribución gaussiana es especial.

Como se señala en los comentarios, la desigualdad de Chebyshev es útil para tener un sentimiento. Sin embargo hay más .

Keith
fuente
9

Es la raíz cuadrada del segundo momento central , la varianza. Los momentos están relacionados con funciones características (CF), que se denominan características por la razón de que definen la distribución de probabilidad. Entonces, si conoce todos los momentos, conoce CF; por lo tanto, conoce toda la distribución de probabilidad.

La función característica de la distribución normal se define por solo dos momentos: la media y la varianza (o desviación estándar). Por lo tanto, para una distribución normal, la desviación estándar es especialmente importante, es el 50% de su definición de alguna manera.

Para otras distribuciones, la desviación estándar es de alguna manera menos importante porque tienen otros momentos. Sin embargo, para muchas distribuciones utilizadas en la práctica, los primeros momentos son los más grandes, por lo que son los más importantes para saber.

Ahora, intuitivamente, la media le dice dónde está el centro de su distribución, mientras que la desviación estándar le dice qué tan cerca de este centro están sus datos.

Como la desviación estándar está en las unidades de la variable, también se usa para escalar otros momentos para obtener medidas como la curtosis . La curtosis es una métrica adimensional que le indica qué tan gordas son las colas de su distribución en comparación con lo normal

Aksakal
fuente
1
"Ahora, intuitivamente, la media te dice dónde está el centro de tu distribución, mientras que la desviación estándar te dice qué tan cerca de este centro están tus datos". - ¿No se aplicaría esto solo si la distribución es Normal? De lo contrario, la mayoría de las veces, la mediana es una mejor medida de tendencia central.
Dan Temkin
@DanTemkin Cuando se usa la mediana, la desviación estándar pierde su valor hasta cierto punto. Se calcula fuera de la media. Con la mediana, entonces tiene sentido hablar de cuantiles, que podría ser un camino a seguir con distribuciones sesgadas. Sin embargo, OP no se centró en distribuciones sesgadas. Entonces, para cualquier distribución simétrica que tenga media = mediana, no tiene que ser superior sea normal. Por lo tanto, tiene sentido hablar de media cuando se discute la desviación estándar.
Aksakal
4

La desviación estándar de la muestra es una medida de la desviación de los valores observados de la media, en las mismas unidades para medir los datos. Distribución normal, o no.

Alexis
fuente