Preguntándose qué significa este gráfico de análisis de parcela de frijoles

11

¿Cómo se interpretan y generan gráficos de trama de frijoles? Aquí hay un ejemplo tomado de Walkes et al. 2010 . ¿Para qué tipo de datos es más útil?

parcela de frijoles
(fuente: biomedcentral.com )

Vanson Samuel
fuente
3
"Un diagrama de frijoles es una alternativa al diagrama de caja para la comparación visual de datos univariados entre grupos. En un diagrama de frijoles, las observaciones individuales se muestran como pequeñas líneas en un diagrama de dispersión unidimensional. Además de eso, la densidad estimada de las distribuciones es visible y se muestra el promedio ". Extracto tomado de aquí .
Para aquellos que no saben: este es un pariente cercano de la trama del violín (violín).

Respuestas:

12

Los diagramas de caja se diseñaron realmente para datos normales, o al menos datos unimodales. El Beanplot le muestra la curva de densidad real, que es más informativa.

La forma es la densidad, y las líneas horizontales cortas representan cada punto de datos. Esto combina lo mejor de un diagrama de caja, diagrama de densidad y diagrama de alfombra, todo en uno y es muy legible.

Desafortunadamente, el ejemplo que ha elegido decidió agregar un montón de líneas más largas que desordenan el gráfico más allá del reconocimiento (para mí). [recorte]

EDITAR: Después de haber trabajado un poco más con el diagrama de frijoles, las líneas gruesas más largas son la media (u opcionalmente mediana) para cada grano. Las líneas delgadas más largas son los datos, con una especie de "apilamiento" donde las líneas más anchas indican valores más duplicados. (También puede alterarlos, lo que prefiero, pero al menos la categoría "normal" ya tiene una densidad justa de puntos que podrían empeorar).

Todavía creo que el ejemplo que elegiste es bastante desordenado, lo que tal vez podría resolverse usando fluctuaciones en lugar de apilar.

El artículo que describe el paquete R para hacer gráficos de frijoles es una buena lectura.

Wayne
fuente
3
+1 - leyendo el artículo de trama de frijoles ahora. También sugeriría un documento de trabajo de Hadley Wickham, 40 años de diagramas de caja . Pasa por una descripción de una variedad de parcelas con más o menos los mismos objetivos que las parcelas de frijol.
Andy W
1

Sin haber leído todo el documento, parece ser esencialmente una variante de la gráfica de caja. Como tal, podría usarlo donde de otro modo hubiera usado un diagrama de caja, como comparar las distribuciones univariadas de varios grupos. Muestra una línea para cada punto y superpone una estimación de densidad del núcleo. Al mirarlo, creo que podría ser más informativo con pequeñas cantidades de datos, pero estar demasiado abarrotado con más datos. A primera vista, no me parece muy estremecedor. Si quieres saber algo más, elabora tu pregunta.

gung - Restablece a Monica
fuente