Intuición y usos del coeficiente de variación.

11

Actualmente estoy asistiendo al curso Una Introducción a la Gestión de Operaciones en Coursera.org. En algún momento del curso, el profesor comenzó a lidiar con la variación en el tiempo de las operaciones.

La medida que usa es el coeficiente de variación , la relación entre la desviación estándar y la media:

cv=σμ

¿Por qué se usaría esta medida? ¿Cuáles son las ventajas y desventajas de trabajar con CV además de trabajar con, por ejemplo, la desviación estándar? ¿Cuál es la intuición detrás de esta medida?

Lucas Reis
fuente

Respuestas:

8

Pienso en ello como una medida relativa de propagación o variabilidad en los datos. Si piensa en la afirmación, "La desviación estándar es 2.4", realmente no le dice nada sin respecto a la media (y, por lo tanto, la unidad de medida, supongo). Si la media es igual a 104, la desviación estándar de 2.4 comunica una imagen bastante diferente de la propagación que si la media fuera 25.452 con una desviación estándar de 2.4.

La misma razón por la que normaliza los datos (resta la media y divide por la desviación estándar) para colocar los datos expresados ​​en diferentes unidades en una base comparable o igual, por lo que también se normaliza esta medida de variabilidad, para ayudar en las comparaciones.

B_Miner
fuente
2

El coeficiente de variación es efectivamente una medida normalizada o relativa de la variación en un conjunto de datos (por ejemplo, una serie de tiempo) en el sentido de que es una proporción (y, por lo tanto, puede expresarse como un porcentaje). Intuitivamente, si la media es el valor esperado, entonces el coeficiente de variación es la variabilidad esperada de una medición, en relación con la media.

Esto es útil cuando se comparan mediciones en múltiples conjuntos de datos heterogéneos o en múltiples mediciones tomadas en el mismo conjunto de datos: el coeficiente de variación entre dos conjuntos de datos, o calculado para dos conjuntos de mediciones, se puede comparar directamente, incluso si los datos en cada uno son medido en escalas, frecuencias de muestreo o resoluciones muy diferentes. Por el contrario, la desviación estándar es específica de la medida / muestra de la que se obtiene, es decir, es una medida de variación absoluta más que relativa.

BGreene
fuente
¿Puede explicar esta parte más por favor: "El coeficiente de variación es la variabilidad esperada de una medición en un intervalo"?
B_Miner
@B_Miner quise decir intervalo en el sentido del procesamiento de la señal y he editado anteriormente. Std dev es efectivamente la variación media o esperada.
BGreene
-2

Según tengo entendido, la media es el parámetro de ubicación. SD / media no debe considerarse como coeficiente de variación. ¿por qué? El argumento simple es que la distancia estadística es diferente de la distancia euclidiana. para medir la distancia estadística usamos sd; distancia bruta para una variable. supongamos que 50 es media y 2 es sd, entonces 4% será cv. ahora es media es 5 y sd es 2 cv = 40%. El término de variación estadística es independiente del origen. Entonces, SD es una buena medida de variación. y recuerde una regla de la física que es no comparar dos sistemas unitarios en un solo problema.

Devendra Tandle
fuente
2
Es difícil ver un argumento coherente aquí. ¿No deberíamos considerar sd / mean como el coeficiente de variación? Así es como se define. Si quiere decir que no es útil, explique por qué. (Si crees que está mal llamado, esa es una historia diferente). ¿La distancia estadística difiere de la distancia euclidiana? Eso es solo una afirmación y depende de saber qué quieres decir con distancia estadística. Como muchos tipos de distancia aparecen en las estadísticas, la afirmación sigue siendo oscura. (No voté en contra, pero le insto a que vuelva a escribir esto. Es posible que necesite trabajar con un amigo con un mejor dominio del inglés escrito.)
Nick Cox