La diferencia es estadística resumida: coeficiente de Gini y desviación estándar

12

Hay varias estadísticas resumidas. Cuando desee describir la propagación de una distribución, puede utilizar, por ejemplo, la desviación estándar o el coeficiente de Gini .

Sé que la desviación estándar se basa en la tendencia central, es decir, la desviación de la media, y el coeficiente de Gini es una medida general de dispersión. También sé que el coeficiente de Gini tiene un límite inferior y superior [0 1], y la desviación estándar no . Es bueno saber estas propiedades, pero ¿qué ideas puede dar la desviación estándar que el Gini no puede y viceversa? Si tuviera que elegir usar uno de los dos, ¿cuáles son las ventajas de usar uno en comparación con otro cuando se trata de ser informativo y perspicaz?

Olivier_s_j
fuente
1
Tenías una extraña elección de etiquetas. Los edité
ameba

Respuestas:

8

Dos cosas a tener en cuenta

El Gini es independiente de la escala, mientras que el SD está en las unidades originales.

Supongamos que tenemos una medida limitada arriba y abajo. SD adquiere su valor máximo si la mitad de las mediciones están en cada límite, mientras que Gini toma el máximo si uno está en un límite y el resto en el otro.

mdewey
fuente
¿Crees que podríamos ampliar el uso de Gini para tener en cuenta la concentración / heterogeneidad en el metanálisis? Podría ser interesante como un medio para cuantificar la concentración en la heterogeneidad ...
Joe_74
1
Como se supone que los efectos son normales, entonces no. Pero creo que una discusión más completa está fuera de tema en este hilo
mdewey
@mdewey Esa última oración fue perspicaz y me ayudó más. ¡Gracias!
Olivier_s_j
@mdewey Probé esto yo mismo con algún código, pero ¿hay alguna publicación en algún lugar que discuta esto? O una prueba? (Me refiero a la última oración)
Olivier_s_j
@Ojtwist es útil el artículo de Wikipedia en.wikipedia.org/wiki/Gini_coefficient .
mdewey
10

El coeficiente de Gini es invariante a escala y está limitado, la desviación estándar es invariante a un cambio y no está limitado, por lo que son difíciles de comparar directamente. Ahora puede definir una versión invariante de escala de la desviación estándar, dividiendo por la media (coeficiente de variación).

Sin embargo, el índice de Gini todavía se basa en valores, el segundo en valores al cuadrado, por lo que puede esperar que el segundo esté más influenciado por valores atípicos (valores excesivamente bajos o altos). Esto se puede encontrar en Medidas de desigualdad de ingresos , F De Maio, 2007:

Esta medida de desigualdad del ingreso se calcula dividiendo la desviación estándar de la distribución del ingreso por su media. Distribuciones de ingresos más iguales tendrán desviaciones estándar más pequeñas; como tal, el CV será más pequeño en sociedades más igualitarias. A pesar de ser una de las medidas más simples de desigualdad, el uso del CV ha sido bastante limitado en la literatura de salud pública y no ha aparecido en la investigación sobre la hipótesis de la desigualdad de ingresos. Esto puede atribuirse a limitaciones importantes de la medida CV: (1) no tiene un límite superior, a diferencia del coeficiente de Gini, 18 lo que dificulta un poco más la interpretación y la comparación; y (2) los dos componentes del CV (la media y la desviación estándar) pueden verse excesivamente influenciados por valores de ingresos anormalmente bajos o altos. En otras palabras,

1(xm)=|xnm|1/2N2(x)1(x)N2(x)

1/2

1/2

Entonces, a menos que desee caracterizar una distribución casi gaussiana, si desea medir una dispersión, use el índice de Gini, si desea promover la dispersión entre los diferentes modelos, puede probar una relación de norma.

Conferencia adicional: Diferencia media de Gini: una medida superior de variabilidad para distribuciones no normales , Shlomo Yitzhaki, 2003, cuyo resumen puede parecer interesante:

De todas las medidas de variabilidad, la varianza es, con mucho, la más popular. Este artículo argumenta que la diferencia de medias de Gini (GMD), un índice alternativo de variabilidad, comparte muchas propiedades con la varianza, pero puede ser más informativo sobre las propiedades de las distribuciones que se apartan de la normalidad

Laurent Duval
fuente
1

La desviación estándar tiene una escala (por ejemplo, ° K, metros, mmHg, ...). Por lo general, esto influye en nuestro juicio sobre su magnitud. Por lo tanto, tendemos a preferir el coeficiente de variación o incluso mejor (en muestras finitas) al error estándar.

[0,1]

Horst Grünbusch
fuente