Trazado de resultados que solo tienen media y desviación estándar

11

Estoy tratando de visualizar una gráfica apropiada para las observaciones en esta tabla de medias y desviaciones estándar de los puntajes de recuerdo:

ControlExperimentalMeanSDMeanSDRecall378216

¿Cuál es la mejor manera de hacer eso? ¿Es el gráfico de barras una buena manera de hacerlo? ¿Cómo puedo ilustrar la desviación estándar en ese caso?

yo ..
fuente
11
Si no tiene más datos, no crearía un gráfico. Sería una pérdida de espacio.
Roland
44
Si no tiene más que esto, un análisis completo es difícil, ya que estos medios y SD son compatibles con muchas distribuciones diferentes.
Nick Cox

Respuestas:

9

La desviación estándar en los gráficos de barras se puede ilustrar mediante la inclusión de barras de error en ellos.

La visualización ( fuente ) a continuación es un ejemplo de dicha visualización:

ingrese la descripción de la imagen aquí


De una discusión en los comentarios a continuación, tener solo los bigotes de error en lugar de la configuración de barras de error parece una mejor manera de visualizar dichos datos. Entonces, el gráfico puede verse más o menos así:

ingrese la descripción de la imagen aquí

Dawny33
fuente
44
El principio está claramente en la línea correcta, pero sugeriría mejoras en su gráfico. Si los contenedores son para tocar intervalos, entonces los bares también deberían tocarse e indicar que solo los límites del contenedor son suficientes. Independientemente de eso, la trama cruzada es, en mi opinión, solo una distracción aquí. Por cierto, ¿cómo denotarías un error para un recuento observado cero?
Nick Cox
2
Al menos este ejemplo tiene las barras de error en ambos lados, las peores " parcelas de dinamita " ni siquiera tienen esas, vea aquí para ver un ejemplo.
Andy W
1
¡No! Me refería a trazar bigotes de error sin trazar las barras. Los bares son malos.
ameba dice Reinstate Monica
3
Creo que las barras pueden estar bien para recuentos pequeños, como en este ejemplo, y para algunas otras cantidades medidas también con origen natural y nivel de referencia cero, siempre que no ocluyan barras de error. Pero las barras pueden ser tontas y distractoras (en lugar de malas) cuando no es un problema si los valores son o no cero.
Nick Cox
2
Otra posibilidad es un diagrama de puntos de Cleveland ( pdf ), que es esencialmente el mismo que su versión de punto y bigote, excepto que van horizontalmente. Las barras de error son menos comunes en las gráficas de puntos, pero ciertamente son aceptables.
gung - Restablece a Monica
8

Sugeriría un diagrama de puntos:

Aunque todavía hay margen de mejora (quizás atenuando los bordes del gran rectángulo que rodea los datos), casi toda la tinta se está utilizando para mostrar información.

ToughTea
fuente
1
¿Cómo responde esto a la pregunta del OP? ¿Cómo se usa dotplot con medias y desviaciones estándar?
kjetil b halvorsen
1
Esta página de desbordamiento de pila analiza cómo generar diagramas de puntos a partir de medios y SD.
EdM
3
@kjetilbhavlorsen: la media es el punto, y la desviación estándar (u opcionalmente, el error estándar de la media) se muestra usando la longitud de las líneas adyacentes al punto.
3
(+1) El término "diagrama de puntos" está bastante sobrecargado, mi primer pensamiento fue que sugeriría dibujar puntos para cada punto de datos (lo que, por supuesto, el OP no puede hacer, sin tener los datos sin procesar). Sospecho que esto es lo que @kjetil también se preguntó. ¿Esta variedad de "diagrama de puntos" tiene un nombre más específico que lo distingue del tipo de diagrama de "punto para cada punto de datos"?
Silverfish
0

Quizás la mejor manera de visualizar el tipo de datos que da lugar a ese tipo de resultados es simular un conjunto de datos de unos pocos cientos o unos pocos miles de puntos de datos donde una variable (control) tiene media 37 y desviación estándar 8 mientras que la otra (experimental) tiene hombres 21 y desviación estándar 6. La simulación es lo suficientemente simple en una hoja de cálculo o en su paquete de estadísticas favorito. Luego puede graficar las dos distribuciones para tener una idea del grado en que varían los dos conjuntos de puntajes de recuerdo.

gráfico simple de Excel

Con un conjunto de datos simulado, también puede construir fácilmente gráficos de resumen como diagramas de caja o histogramas con barras de error.

Kevin Mahoney
fuente