Visualización de datos de respuesta de elementos Likert

25

¿Cuáles son buenas maneras de visualizar un conjunto de respuestas Likert?

Por ejemplo, ¿un conjunto de elementos que indagan sobre la importancia de X para las decisiones de uno sobre A, B, C, D, E, F y G? ¿Hay algo mejor que los gráficos de barras apiladas?

  • ¿Qué se debe hacer con las respuestas de N / A? ¿Cómo podrían ser representados?
  • ¿Deben los gráficos de barras informar porcentajes o número de respuestas? (es decir, ¿las barras deben sumar la misma longitud?)
  • Si se trata de porcentajes, ¿el denominador debe incluir respuestas no válidas y / o N / A?

Tengo mis propios puntos de vista, pero estoy buscando ideas de otras personas.

chl
fuente

Respuestas:

30

Me gusta la vista de conteo centrado. Esta versión en particular elimina las respuestas neutrales (tratando efectivamente a los neutrales y n / a como lo mismo) para mostrar solo la cantidad de opiniones de acuerdo / desacuerdo. El punto 0 es donde se encuentran el rojo y el azul. El eje de recuento se recorta.

texto alternativo

A modo de comparación, aquí están las mismas cinco respuestas que los porcentajes apilados, que muestran tanto neutral (gris) como sin respuesta (blanco).

texto alternativo

Actualización: Documento que sugiere un método similar: trazar Likert y otras escalas de calificación (PDF)

xan
fuente
2
(+1) ¡Interesante! ¿Qué software usas? Solo una observación: no hay indicación sobre valores absolutos para% o recuentos, por lo que esto parece permitir solo una interpretación relativa.
chl
Lo siento, no leí tu última oración (el eje x es invisible). Intentaré otra observación: ¿Hay alguna posibilidad de que los recuentos de NA sean visibles en la vista centrada (es decir, distinguirlos de neutral)?
chl
@chl Gracias. Yo uso JMP, que me pagan por trabajar. El primero es un gráfico de barras apiladas con valores positivos y negativos, que debería ser posible en muchas herramientas. Los recuentos de NA se pueden hacer de diferentes maneras (en un extremo, divididos en ambos extremos, en la columna intermedia del medio) y ninguno parece obviamente mejor para la mayoría de las situaciones.
xan
2
Solo quería agregar a los Rusuarios que este tipo de parcelas se implementan en el paquete HH. Para darle una impresión, puede intentarlo likert(t(apply(data, 2, table))).
hplieninger
1
Creo que la referencia es "B Robbins, Naomi; M Heiberger, Richard (2011)." Trazado de Likert y otras escalas de calificación ". JSM 2011: 1058-1066".
Kit Johnson
23

Los gráficos de barras apilados generalmente son bien entendidos por los no estadísticos, siempre que se introduzcan con cuidado. Es útil escalarlos en una métrica común (p. Ej., 0-100%), con un color gradual para cada categoría si son elementos ordinales (p. Ej. Likert). Prefiero dotchart (diagrama de puntos de Cleveland), cuando no hay demasiados elementos y no hay más de 3-5 categorías de respuestas. Pero es realmente una cuestión de claridad visual. Generalmente proporciono%, ya que es una medida estandarizada, y solo informo tanto el% como el recuento con un gráfico de barras no apilado. Aquí hay un ejemplo de lo que quiero decir:

data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
       apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)", 
         sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)

texto alternativo

Se podría lograr una mejor representación con latticeo ggplot2. Todos los ítems tienen las mismas categorías de respuesta en este ejemplo en particular, pero en un caso más general podríamos esperar diferentes, por lo que mostrarlos no parecería redundante como es el caso aquí. Sin embargo, sería posible dar el mismo color a cada categoría de respuesta para facilitar la lectura.

Pero diría que los gráficos de barras apilados son mejores cuando todos los ítems tienen la misma categoría de respuesta, ya que ayudan a apreciar la frecuencia de una modalidad de respuesta entre ítems:

texto alternativo

También puedo pensar en algún tipo de mapa de calor, que es útil si hay muchos elementos con una categoría de respuesta similar. texto alternativo

Las respuestas faltantes (especialmente cuando no son insignificantes o están localizadas en un ítem / pregunta específica) deben ser reportadas, idealmente para cada ítem. En general, el% de respuestas para cada categoría se calcula sin NA. Esto es lo que generalmente se hace en encuestas o psicometría (hablamos de "respuestas expresadas u observadas").

PD Se me ocurren más cosas de lujo como la imagen se muestra a continuación (el primero fue hecho a mano, el segundo es de ggplot2, ggfluctuation(as.table(tab))), pero no creo que se transmiten como información precisa como diagrama de puntos o diagrama de barras ya que las variaciones de la superficie son difíciles de apreciar. texto alternativo

texto alternativo

chl
fuente
2
Por cierto, una pregunta sobre cómo graficar las respuestas de la escala Likert acaba de encontrar ayer en el blog de Andrew Gelman :) j.mp/aBm8mZ
chl
14

Creo que la respuesta de chl es genial.

Una cosa que podría agregar es que, para el caso, desearía comparar la correlación entre los elementos. Para eso, puede usar algo como una matriz de diagrama de dispersión de correlación para datos categóricos ordenados

texto alternativo

(Ese código todavía necesita algunos ajustes, pero da la idea general ...)

Tal Galili
fuente
3
(+1) Esto me recuerda la pairs.panelsfunción en el psychpaquete de W Revelle.
chl
Interesante. Encontré ese código, pero nunca supe que también existía en el paquete psicológico. Estoy seguro de que me inspiró de alguna manera cuando escribí esa publicación (debería agregar esto a los créditos en la publicación ...)
Tal Galili