Asimetría, curtosis y cuántos valores de desviaciones estándar son de la media

8

Como es bien sabido para la distribución normal, el 68% de la masa de probabilidad está dentro de una desviación estándar de la media, el 95% dentro de dos desviaciones estándar y el 99,7% dentro de 3 desviaciones estándar.

Sin embargo, tengo algunas distribuciones empíricas que son leptokurtic y negativamente sesgadas. En tales circunstancias, ¿existe una fórmula basada en sus momentos de orden superior para calcular cuánto de la masa de probabilidad está dentro de tantas desviaciones estándar de la media?

Tengo una medida y me gustaría dar una idea de cuán lejos está del punto medio (media u otra medida de tendencia central).

Se puede hacer esto?

Baz
fuente
Sin algunas suposiciones adicionales no puedes hacer todo eso. Vea, por ejemplo, los muchos ejemplos de distribuciones con la misma asimetría y curtosis que la normal aquí ; tienen una gran variedad de comportamientos cuantiles diferentes (sin ningún intento de explorar el posible alcance de esos comportamientos). Efectos similares ocurren en otros valores de asimetría y curtosis.
Glen_b -Reinstate Monica

Respuestas:

8

Siempre puede calcular cuántos valores SD son de la media simplemente conectando valores de muestra, (valor mean) / SD, y luego binning y contando.

Los hechos numéricos precisos, como los que cita para lo normal (gaussiano) en general, dependen de conocer una o más de las funciones de densidad, distribución o cuantil, numéricamente si no analíticamente.

Sin embargo, no hay relaciones generales disponibles sobre solo conocer la asimetría o curtosis. La asimetría y la curtosis no determinan la forma de la distribución en general, ya que los momentos más altos también pueden variar.

Nick Cox
fuente
0

Aquí hay una respuesta precisa que muestra que la desviación absoluta media de la media no está necesariamente relacionada con la curtosis.

Considere la familia de distribuciones de X=μ+σZ, dónde Z tiene la distribución discreta

Z=0.5, con probabilidad (wp) .25

=+0.5wp .25

=1.2wp .25θ/2

=+1.2wp .25θ/2

=0.155/θ+1.44wp θ/2

=+0.155/θ+1.44wp θ/2.

La familia de distribuciones de X está indexado por tres parámetros: μ, σy θ, con rangos (,+), (0,+) y (0,.5).

En esta familia E(X)=μ, Var(X)=σ2, y la mediana de la desviación absoluta de la media es 0.5σ.

La curtosis de X es como sigue:

curtosis =E(Z4)=.54.5+1.24(.5θ)+(0.155/θ+1.44)2θ.

Dentro de esta familia,

(i) la curtosis tiende al infinito como θ0.

(ii) la distribución dentro de los "hombros" (es decir, dentro de la μ±σrango) es constante para todos los valores de curtosis; son simplemente los dos puntosμ±σ/2wp 0.25cada. Esto proporciona un contraejemplo a una interpretación de la curtosis, que establece que la curtosis más grande implica el movimiento de la masa lejos de los hombros, simultáneamente en el rango entre los hombros y hacia las colas.

(iii) el "pico" de la distribución también es constante para todos los valores de curtosis; de nuevo, son simplemente los dos puntosμ±σ/2wp 0.25cada. Esto proporciona un contraejemplo a la interpretación a menudo dada pero obviamente incorrecta de que la curtosis más grande implica una distribución más "puntiaguda".

En esta familia, la porción central de la distribución en realidad se vuelve más plana a medida que aumenta la curtosis, ya que las probabilidades en μ±1.2σ y μ±0.5σ converger al mismo valor, 0.25, a medida que aumenta la curtosis.

(iv) La mediana de la desviación absoluta de la media es constante, 0.5σ, para todos los valores de curtosis.

Peter Westfall
fuente