Interpretación de violines

9

Estoy comparando la distribución de diferentes grupos usando las gráficas de violín, sin embargo, la mayoría de los recursos en línea que encontré están relacionados con cómo hacer las gráficas y una interpretación muy básica de los resultados (la variación mediana, los datos están agrupados o no).

Estoy buscando ejemplos detallados que pueda seguir como mi guía para interpretar correctamente las tramas de violín.

Gago-Silva
fuente

Respuestas:

9

Una trama de violín es solo un histograma (o más a menudo una variante suavizada como una densidad del núcleo) volteada de lado y reflejada. Cualquier libro de texto que le enseñe a interpretar histogramas debería darle la intuición que busca. Editar según la sugerencia de Nick Cox: Freedman, Pisani, Purves, Statistics cubre histogramas.

En cuanto a interpretarlos de una manera más formal, el objetivo de graficar la distribución es ver cosas por las que las pruebas estadísticas podrían ser engañadas.

Una cosa que me gusta hacer con los violines es agregar líneas para la mediana, la media, etc. A veces superpongo un diagrama de caja para poder ver aún más en el resumen de estadísticas.

Al menos, debería poder detectar cualquier desviación grave en los primeros momentos (media, dispersión, asimetría, curtosis), así como bimodalidad y valores atípicos.

Ari B. Friedman
fuente
2
+1, una gráfica similar es una pirámide de población , la distribución reflejada es solo una categoría diferente (y utiliza estimadores de tipo de histograma más típicos en lugar de kde).
Andy W
1
Ni Tukey, Análisis de datos exploratorios , ni Cleveland, Elementos de datos gráficos , dicen mucho sobre histogramas: ambos están más interesados ​​y más impresionados por otras representaciones. ¿Esos son los libros mencionados aquí? Un libro que cubre histogramas como básicos es Freedman, Pisani, Purves, Statistics .
Nick Cox
1
En realidad, Cleveland no decir algo sobre histogramas. Él dice que son gráficos pobres y que no se utilizarán en su libro. :-). Y F, P y P es un libro maravilloso.
Peter Flom - Restablece a Monica
1
He enseñado desde FPP. No usarían explícitamente OLS para predecir el área de un rectángulo, porque no hacen explícitamente una regresión multivariada. Sin embargo, tienen algunos ejemplos en este espíritu. Por ejemplo, ¿qué pasaría si Galileo hubiera intentado predecir el tiempo t que tarda un objeto en caer desde la altura h mediante regresión lineal? Obtiene un buen ajuste de mínimos cuadrados, pero, por supuesto, la verdad es : la moraleja de la historia es mirar siempre los residuos. t=ch
Michael Lugo
1
@TrevorAlexander Esa es una buena pregunta. No conozco ninguna literatura que muestre que la interpretación es mejor cuando se refleja, pero se ven mejor que los histogramas en una orientación vertical, al menos para mi ojo.
Ari B. Friedman