¿Cómo se interpretan y generan gráficos de trama de frijoles? Aquí hay un ejemplo tomado de Walkes et al. 2010 . ¿Para qué tipo de datos es más útil?
(fuente: biomedcentral.com )
data-visualization
boxplot
Vanson Samuel
fuente
fuente
Respuestas:
Los diagramas de caja se diseñaron realmente para datos normales, o al menos datos unimodales. El Beanplot le muestra la curva de densidad real, que es más informativa.
La forma es la densidad, y las líneas horizontales cortas representan cada punto de datos. Esto combina lo mejor de un diagrama de caja, diagrama de densidad y diagrama de alfombra, todo en uno y es muy legible.
Desafortunadamente, el ejemplo que ha elegido decidió agregar un montón de líneas más largas que desordenan el gráfico más allá del reconocimiento (para mí). [recorte]
EDITAR: Después de haber trabajado un poco más con el diagrama de frijoles, las líneas gruesas más largas son la media (u opcionalmente mediana) para cada grano. Las líneas delgadas más largas son los datos, con una especie de "apilamiento" donde las líneas más anchas indican valores más duplicados. (También puede alterarlos, lo que prefiero, pero al menos la categoría "normal" ya tiene una densidad justa de puntos que podrían empeorar).
Todavía creo que el ejemplo que elegiste es bastante desordenado, lo que tal vez podría resolverse usando fluctuaciones en lugar de apilar.
El artículo que describe el paquete R para hacer gráficos de frijoles es una buena lectura.
fuente
Sin haber leído todo el documento, parece ser esencialmente una variante de la gráfica de caja. Como tal, podría usarlo donde de otro modo hubiera usado un diagrama de caja, como comparar las distribuciones univariadas de varios grupos. Muestra una línea para cada punto y superpone una estimación de densidad del núcleo. Al mirarlo, creo que podría ser más informativo con pequeñas cantidades de datos, pero estar demasiado abarrotado con más datos. A primera vista, no me parece muy estremecedor. Si quieres saber algo más, elabora tu pregunta.
fuente