Hay varias estadísticas resumidas. Cuando desee describir la propagación de una distribución, puede utilizar, por ejemplo, la desviación estándar o el coeficiente de Gini .
Sé que la desviación estándar se basa en la tendencia central, es decir, la desviación de la media, y el coeficiente de Gini es una medida general de dispersión. También sé que el coeficiente de Gini tiene un límite inferior y superior [0 1], y la desviación estándar no . Es bueno saber estas propiedades, pero ¿qué ideas puede dar la desviación estándar que el Gini no puede y viceversa? Si tuviera que elegir usar uno de los dos, ¿cuáles son las ventajas de usar uno en comparación con otro cuando se trata de ser informativo y perspicaz?
standard-deviation
descriptive-statistics
gini
Olivier_s_j
fuente
fuente
Respuestas:
Dos cosas a tener en cuenta
El Gini es independiente de la escala, mientras que el SD está en las unidades originales.
Supongamos que tenemos una medida limitada arriba y abajo. SD adquiere su valor máximo si la mitad de las mediciones están en cada límite, mientras que Gini toma el máximo si uno está en un límite y el resto en el otro.
fuente
El coeficiente de Gini es invariante a escala y está limitado, la desviación estándar es invariante a un cambio y no está limitado, por lo que son difíciles de comparar directamente. Ahora puede definir una versión invariante de escala de la desviación estándar, dividiendo por la media (coeficiente de variación).
Sin embargo, el índice de Gini todavía se basa en valores, el segundo en valores al cuadrado, por lo que puede esperar que el segundo esté más influenciado por valores atípicos (valores excesivamente bajos o altos). Esto se puede encontrar en Medidas de desigualdad de ingresos , F De Maio, 2007:
Entonces, a menos que desee caracterizar una distribución casi gaussiana, si desea medir una dispersión, use el índice de Gini, si desea promover la dispersión entre los diferentes modelos, puede probar una relación de norma.
Conferencia adicional: Diferencia media de Gini: una medida superior de variabilidad para distribuciones no normales , Shlomo Yitzhaki, 2003, cuyo resumen puede parecer interesante:
fuente
La desviación estándar tiene una escala (por ejemplo, ° K, metros, mmHg, ...). Por lo general, esto influye en nuestro juicio sobre su magnitud. Por lo tanto, tendemos a preferir el coeficiente de variación o incluso mejor (en muestras finitas) al error estándar.
fuente