En mayo de 2010, el usuario de Wikipedia Mcorazao agregó una oración al artículo de asimetría que dice "Un valor cero indica que los valores están distribuidos de manera relativamente uniforme en ambos lados de la media, lo que generalmente implica una distribución simétrica, pero no necesariamente." Sin embargo, la página wiki no tiene ejemplos reales de distribuciones que rompan esta regla. Buscar en Google "distribuciones asimétricas de ejemplo con asimetría cero" tampoco ofrece ejemplos reales, al menos en los primeros 20 resultados.
Usando la definición de que el sesgo se calcula por , y la R fórmula
sum((x-mean(x))^3)/(length(x) * sd(x)^3)
Puedo construir una distribución pequeña y arbitraria para reducir el sesgo. Por ejemplo, la distribución.
x = c(1, 3.122, 5, 4, 1.1)
produce un sesgo de . Pero esta es una muestra pequeña y, además, la desviación de la simetría no es grande. Entonces, ¿es posible construir una distribución más grande con un pico que sea altamente asimétrico pero que aún tenga un sesgo de casi cero?
fuente
Respuestas:
Considere distribuciones discretas. Uno que es compatible con los valores está determinado por las probabilidades no negativas sujeto a las condiciones que (a) suman 1 y (b) el coeficiente de asimetría es igual 0 (que es equivalente a que el tercer momento central sea cero). Eso deja grados de libertad (en el sentido de resolución de ecuaciones, ¡no el estadístico!). Podemos esperar encontrar soluciones que sean unimodales.x 1 , x 2 , … , x k p 1 , p 2 , … , p k k - 2k x1,x2,…,xk p1,p2,…,pk k−2
Para facilitar la búsqueda de ejemplos, busqué soluciones compatibles con un pequeño vector simétrico con un modo único en , media cero y cero asimetría. Una de esas soluciones es .0 ( p 1 , … , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600x=(−3,−2,−1,0,1,2,3) 0 ( p1, ... , p7 7) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600
Puedes ver que es asimétrico.
Aquí hay una solución asimétrica más obvia con (que es asimétrica) y :p = ( 1 , 18 , 72 , 13 , 4 ) / 108x=(−3,−1,0,1,2) p=(1,18,72,13,4)/108
Ahora es obvio lo que está sucediendo: debido a que la media es igual a , los valores negativos contribuyen y al tercer momento, mientras que los valores positivos contribuyen y 13 × 1 3 = 13 , equilibrando exactamente las contribuciones negativas. Podemos tomar una distribución simétrica de aproximadamente 0 , como x = ( - 1 , 0 , 1 ) con , y cambiar una pequeña masa de a( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 - 1 - 3 0 00 (−3)3=−27 18×(−1)3=−18 4×23=32 13×13=13 0 x =(-1 ,0,1) p =(1,4,1) / 6 + 1 + 2 , una pequeña masa de a , y una pequeña cantidad de masa a , manteniendo la media en y la asimetría en , al tiempo que crea una asimetría. El mismo enfoque funcionará para mantener una media cero y una asimetría cero de una distribución continua mientras la hace asimétrica; Si no somos demasiado agresivos con el cambio de masa, seguirá siendo unimodal.+ 1 - 1 - 3 0 0 0 0
Editar: Distribuciones continuas
Debido a que el problema sigue surgiendo, demos un ejemplo explícito con distribuciones continuas. Peter Flom tuvo una buena idea: mirar mezclas de normales. Una combinación de dos normales no funcionará: cuando su asimetría desaparezca, será simétrica. El siguiente caso más simple es una mezcla de tres normales.
Las mezclas de tres normales, después de una elección adecuada de ubicación y escala, dependen de seis parámetros reales y, por lo tanto, deben tener una flexibilidad más que suficiente para producir una solución asimétrica de asimetría cero. Para encontrar algunos, necesitamos saber cómo calcular las asimetrías de mezclas de normales. Entre estos, buscaremos cualquiera que sea unimodal (es posible que no haya ninguno).
Ahora, en general, el momento (no central) de una distribución normal estándar es cero cuando es impar y de lo contrario es igual a . Cuando reescalamos esa distribución normal estándar para tener una desviación estándar de , el momento se multiplica por . Cuando cambiamos cualquier distribución por , el nuevo momento se puede expresar en términos de momentos hasta e incluyendo r 2 r / 2 Γ ( 1 - rrth r σrthσrμrthr2r / 2Γ ( 1 - r2) / π--√ σ rth σr μ rth r . El momento de una mezcla de distribuciones (es decir, un promedio ponderado de ellas) es el mismo promedio ponderado de los momentos individuales. Finalmente, la asimetría es cero exactamente cuando el tercer momento central es cero, y esto se calcula fácilmente en términos de los primeros tres momentos.
Esto nos da un ataque algebraico al problema. Una solución que encontré es una mezcla igual de tres normales con parámetros igual a , y . Su media es igual a . Esta imagen muestra el pdf en azul y el pdf de la distribución volcó sobre su media en rojo. Que difieran muestra que ambos son asimétricos. (El modo es aproximadamente , desigual a la media de .) Ambos tienen sesgo cero por construcción .( 0 , 1 ) ( 1 / 2 , 1 ) ( 0 , √( μ , σ) ( 0 , 1 ) ( 1 / 2 , 1 ) (0+1/2+0)/3=1/60,05192161/6( 0 , 127 / 18------√) ≈ ( 0 , 2.65623 ) (0+1/2+0)/3=1/6 0.0519216 1/6
Las tramas indican que estos son unimodales. (Puede verificar usando Cálculo para encontrar máximos locales).
fuente
Aquí hay uno que encontré en https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# que encuentro agradable y reproducido en R: una rebaba inversa o distribución Dagum con parámetros de forma y c = 18,1484 :k=0.0629 c=18.1484
Tiene una media de 0.5387, desviación estándar de 0.2907, asimetría de 0.0000 y curtosis de 2.0000. La fuente también lo llama la "distribución del elefante":
Mi reproducción en R fue creada con
Como muestra esta salida, la asimetría no es del todo cero a cuatro dígitos para estos valores de parámetros. Aquí hay un pequeño optimizador para y c :k c
flexible
fuente
Considere una distribución en la mitad positiva de la línea real que aumenta linealmente desde 0 al modo y luego es exponencial a la derecha del modo, pero es continua en el modo.
Esto podría llamarse una distribución triangular-exponencial (aunque a menudo se parece un poco a una aleta de tiburón).
El hilo ¿ Distribuciones no normales con sesgo cero y exceso de curtosis cero? tiene algunos ejemplos asimétricos, incluido un pequeño ejemplo discreto y otro unimodal continuo:
Las distribuciones unimodales discretas, o de manera equivalente, muestras, con sesgo cero son bastante fáciles de construir, de tamaño grande o pequeño.
Aquí hay un ejemplo, que puede tratar como una muestra o (dividiendo las frecuencias sin procesar por 3000) como un pmf (los valores 'x' son los valores tomados, la 'n' es la cantidad de veces que ese valor ocurre en la muestra ):
Este ejemplo está construido a partir de distribuciones de 3 puntos:
Hay toda clase de otros "átomos" que se pueden construir, pero este ejemplo usa solo este tipo. A alguna combinación de átomos como estos se agregan algunos valores colocados simétricamente para completar los agujeros restantes y garantizar la unimodalidad sin destruir la estructura de la media y el tercer momento.
fuente
Seguro. Prueba esto:
(¡Ya hiciste las cosas difíciles!)
fuente
curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
fuente
La siguiente distribución discreta es asimétrica y tiene un sesgo nulo: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Lo encontré en el artículo de Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9
fuente