Como es bien sabido para la distribución normal, el 68% de la masa de probabilidad está dentro de una desviación estándar de la media, el 95% dentro de dos desviaciones estándar y el 99,7% dentro de 3 desviaciones estándar.
Sin embargo, tengo algunas distribuciones empíricas que son leptokurtic y negativamente sesgadas. En tales circunstancias, ¿existe una fórmula basada en sus momentos de orden superior para calcular cuánto de la masa de probabilidad está dentro de tantas desviaciones estándar de la media?
Tengo una medida y me gustaría dar una idea de cuán lejos está del punto medio (media u otra medida de tendencia central).
Se puede hacer esto?
Respuestas:
Siempre puede calcular cuántos valores SD son de la media simplemente conectando valores de muestra, (valor− mean) / SD, y luego binning y contando.
Los hechos numéricos precisos, como los que cita para lo normal (gaussiano) en general, dependen de conocer una o más de las funciones de densidad, distribución o cuantil, numéricamente si no analíticamente.
Sin embargo, no hay relaciones generales disponibles sobre solo conocer la asimetría o curtosis. La asimetría y la curtosis no determinan la forma de la distribución en general, ya que los momentos más altos también pueden variar.
fuente
Aquí hay una respuesta precisa que muestra que la desviación absoluta media de la media no está necesariamente relacionada con la curtosis.
Considere la familia de distribuciones deX=μ+σZ , dónde Z tiene la distribución discreta
La familia de distribuciones deX está indexado por tres parámetros: μ , σ y θ , con rangos (−∞,+∞) , (0,+∞) y (0,.5) .
En esta familiaE(X)=μ , Var(X)=σ2 , y la mediana de la desviación absoluta de la media es 0.5σ .
La curtosis deX es como sigue:
curtosis=E(Z4)=.54∗.5+1.24∗(.5−θ)+(0.155/θ+1.44)2∗θ .
Dentro de esta familia,
(i) la curtosis tiende al infinito comoθ→0 .
(ii) la distribución dentro de los "hombros" (es decir, dentro de laμ±σ rango) es constante para todos los valores de curtosis; son simplemente los dos puntosμ±σ/2 wp 0.25 cada. Esto proporciona un contraejemplo a una interpretación de la curtosis, que establece que la curtosis más grande implica el movimiento de la masa lejos de los hombros, simultáneamente en el rango entre los hombros y hacia las colas.
(iii) el "pico" de la distribución también es constante para todos los valores de curtosis; de nuevo, son simplemente los dos puntosμ±σ/2 wp 0.25 cada. Esto proporciona un contraejemplo a la interpretación a menudo dada pero obviamente incorrecta de que la curtosis más grande implica una distribución más "puntiaguda".
En esta familia, la porción central de la distribución en realidad se vuelve más plana a medida que aumenta la curtosis, ya que las probabilidades enμ±1.2σ y μ±0.5σ converger al mismo valor, 0.25 , a medida que aumenta la curtosis.
(iv) La mediana de la desviación absoluta de la media es constante,0.5σ , para todos los valores de curtosis.
fuente