Cuando se traza una gráfica de caja con python matplotblib, las líneas a la mitad de la gráfica son la mediana de la distribución.
¿Existe la posibilidad de tener la línea en el promedio? O para trazarlo junto a él con un estilo diferente.
Además, debido a que es común que la línea sea la mediana, ¿realmente confundirá a mis lectores si hago el promedio (por supuesto, agregaré una nota sobre cuál es la línea media)?
data-visualization
python
matplotlib
boxplot
Peter Smit
fuente
fuente
Para responder a su segunda pregunta: Sí, creo que será confuso poner la línea en la media en lugar de la mediana. Las reglas precisas que controlan la longitud de los 'bigotes' (si los hay) y el tratamiento de los valores atípicos varían, pero todos usan el cuadro de Tukey para mostrar la mediana y los cuartiles inferior y superior. Para distribuciones muy sesgadas, la media podría estar fuera de la caja, lo que se vería muy extraño. El uso común es que la mediana va con el rango intercuartil, mientras que la media va con la desviación estándar (o error estándar de la media si está interesado en la inferencia en lugar de la descripción de los datos). Si desea mostrar la media visualmente, usaría un símbolo diferente para mostrarla para evitar confusiones.
fuente