Estoy tratando de visualizar algunos datos del consumidor, que tiene 4 categorías. Los usuarios son libres de cambiar entre diferentes categorías. Me gustaría visualizar los últimos tres o cuatro interruptores para cada individuo.
Entonces, comenzaríamos con un gráfico con una columna con 4 proporciones apiladas. Después de eso tendríamos 16, ya que cada categoría se desglosa en lo que la gente hizo en la ocasión anterior, luego 64, y así sucesivamente, hasta que los contenedores se vuelven demasiado pequeños para ser útiles.
Estoy pensando en algún lugar entre un gráfico marimekko y un gráfico de barras apilado o un dendrogramo debería funcionar, ¡pero ni siquiera sé cómo se llamaría eso!
Si alguien puede ayudarme con el tipo de trama que debería usar, y, si quieres ser más amable, cómo implementarlo en R, te lo agradecería mucho.
fuente
Respuestas:
Una idea potencial es el uso de diagramas de Sankey para documentar el flujo de elecciones entre las categorías. Dos ejemplos para describir de lo que estoy hablando son;
Con una actualización sobre algunas de sus preocupaciones expresadas en los comentarios. Me parece que el programa Parallel Sets hace lo que usted quiere fuera de la caja. A continuación se muestra una salida del programa, en el que creé 4 variables aleatorias con 4 categorías. Cualquier grupo que inicialice en la parte superior de la pantalla se dividirá secuencialmente entre las categorías siguientes. Creando la división que deseas.
Tampoco es evidente en esta imagen, el paquete tiene alguna funcionalidad interactiva que permite un análisis de datos exploratorio más fácil, como cuando se pasa el cursor sobre una de las categorías, todos sus descendientes están resaltados.
dec1
dec4
exp
dec
dec3_exp12
121
dec1 = 1 and dec2 = 2 and dec3 = 1
Después de jugar un poco más con Fineo, es una buena aplicación, pero es realmente limitada. Parallel Sets tiene mucha más funcionalidad, por lo que te sugiero que lo verifiques antes de la aplicación Fineo.
Creo que el programa ParSets es una opción mucho mejor que dividir sucesivamente las categorías en subconjuntos para su examen. Por ejemplo, usando los mismos datos aleatorios que el anterior, aquí hay un gráfico de puntos que traza las categorías de proporción en
decision 2
condicional elegido en la categoría elegidadecision 1
.Puede hacer el mismo desglose para el cambio de
decision 2
adecision 3
, pero haga un pequeño gráfico múltiple de lo quedecision 1
fue la inicial .Puede continuar esto infinitamente (ver más abajo). Puede ser esclarecedor, pero sospecho que sería bastante desalentador para cuando llegue a muchos más paneles. A continuación se muestra lo solicitado, visualizando 4 opciones de categoría sucesivas.
Como se señaló anteriormente, los números pequeños para el momento en que divide su gráfico en tantas categorías es problemático. Una forma de dar cuenta de eso es mapear una estética como el tamaño a la línea de base en la que se basa la proporción. Esto reduce las observaciones basadas en números más pequeños de la vista. También podría usar la transparencia (pero ya hice los puntos transparentes para distinguir los puntos superpuestos en este ejemplo).
Me imagino que algunos estaban imaginando un árbol de Navidad como estructura de nodo en lugar de trazados de puntos, pero no sé cómo hacer un gráfico así. Sin embargo, sospecho que sería sospechoso del mismo problema abrumador. Estos pequeños múltiplos no son malos, pero IMO the Parallel Sets es mucho más intuitivo y sospecho que algunos patrones no obvios serían más evidentes en esa visualización. Quizás alguien más imaginativo que yo pueda aportar datos más interesantes que solo 4 categorías aleatorias.
fuente