Visualizando proporciones sucesivas

9

Estoy tratando de visualizar algunos datos del consumidor, que tiene 4 categorías. Los usuarios son libres de cambiar entre diferentes categorías. Me gustaría visualizar los últimos tres o cuatro interruptores para cada individuo.

Entonces, comenzaríamos con un gráfico con una columna con 4 proporciones apiladas. Después de eso tendríamos 16, ya que cada categoría se desglosa en lo que la gente hizo en la ocasión anterior, luego 64, y así sucesivamente, hasta que los contenedores se vuelven demasiado pequeños para ser útiles.

Estoy pensando en algún lugar entre un gráfico marimekko y un gráfico de barras apilado o un dendrogramo debería funcionar, ¡pero ni siquiera sé cómo se llamaría eso!

Si alguien puede ayudarme con el tipo de trama que debería usar, y, si quieres ser más amable, cómo implementarlo en R, te lo agradecería mucho.

Simon Hayward
fuente
¿Qué pasa con el análisis de red? en.wikipedia.org/wiki/Social_network#Social_network_analysis
Roman Luštrik
Idea correcta, pero datos incorrectos para eso. Quiero obtener una columna con proporciones, luego desglosar cada proporción de forma iterativa, para mostrar los predecesores.
Simon Hayward
1
¿Es relevante el orden de los interruptores? Estoy pensando que podría tener 12 valores diferentes: el número que hizo un cambio (en cualquier momento) de cat.1 a 2, 3 o 4, cat. 2 a 1, 3 o 4, y así sucesivamente. Luego, puede visualizar esto con cuatro círculos para las diferentes categorías, y flechas que van y vienen entre los círculos, y el tamaño relativo de las flechas que muestran el número de interruptores.
Jonathan
Por supuesto, si el orden es relevante, puede hacer este mismo gráfico para cada punto en el tiempo. El tamaño cambiante de los círculos mostraría los cambios en cada categoría a lo largo del tiempo.
Jonathan

Respuestas:

11

Una idea potencial es el uso de diagramas de Sankey para documentar el flujo de elecciones entre las categorías. Dos ejemplos para describir de lo que estoy hablando son;


Con una actualización sobre algunas de sus preocupaciones expresadas en los comentarios. Me parece que el programa Parallel Sets hace lo que usted quiere fuera de la caja. A continuación se muestra una salida del programa, en el que creé 4 variables aleatorias con 4 categorías. Cualquier grupo que inicialice en la parte superior de la pantalla se dividirá secuencialmente entre las categorías siguientes. Creando la división que deseas.

ingrese la descripción de la imagen aquí

Tampoco es evidente en esta imagen, el paquete tiene alguna funcionalidad interactiva que permite un análisis de datos exploratorio más fácil, como cuando se pasa el cursor sobre una de las categorías, todos sus descendientes están resaltados.

dec1dec4expdecdec3_exp12121dec1 = 1 and dec2 = 2 and dec3 = 143

Después de jugar un poco más con Fineo, es una buena aplicación, pero es realmente limitada. Parallel Sets tiene mucha más funcionalidad, por lo que te sugiero que lo verifiques antes de la aplicación Fineo.


Creo que el programa ParSets es una opción mucho mejor que dividir sucesivamente las categorías en subconjuntos para su examen. Por ejemplo, usando los mismos datos aleatorios que el anterior, aquí hay un gráfico de puntos que traza las categorías de proporción en decision 2condicional elegido en la categoría elegida decision 1.

ingrese la descripción de la imagen aquí

Puede hacer el mismo desglose para el cambio de decision 2a decision 3, pero haga un pequeño gráfico múltiple de lo que decision 1fue la inicial .

ingrese la descripción de la imagen aquí

Puede continuar esto infinitamente (ver más abajo). Puede ser esclarecedor, pero sospecho que sería bastante desalentador para cuando llegue a muchos más paneles. A continuación se muestra lo solicitado, visualizando 4 opciones de categoría sucesivas.

ingrese la descripción de la imagen aquí

Como se señaló anteriormente, los números pequeños para el momento en que divide su gráfico en tantas categorías es problemático. Una forma de dar cuenta de eso es mapear una estética como el tamaño a la línea de base en la que se basa la proporción. Esto reduce las observaciones basadas en números más pequeños de la vista. También podría usar la transparencia (pero ya hice los puntos transparentes para distinguir los puntos superpuestos en este ejemplo).

ingrese la descripción de la imagen aquí

Me imagino que algunos estaban imaginando un árbol de Navidad como estructura de nodo en lugar de trazados de puntos, pero no sé cómo hacer un gráfico así. Sin embargo, sospecho que sería sospechoso del mismo problema abrumador. Estos pequeños múltiplos no son malos, pero IMO the Parallel Sets es mucho más intuitivo y sospecho que algunos patrones no obvios serían más evidentes en esa visualización. Quizás alguien más imaginativo que yo pueda aportar datos más interesantes que solo 4 categorías aleatorias.

Andy W
fuente
Eso se ve muy útil, gracias.
Simon Hayward
1
@SimonHayward, publique de nuevo con algunos ejemplos si encuentra visualizaciones más interesantes.
Andy W
Hmmmm, en realidad, creo que esto no va a funcionar. Debido a que las clases dentro de cada una de las 5 categorías son las mismas, esto va a agrupar objetos nuevamente, mientras que quiero que se dividan cada vez más finamente. ¡Entonces tengo que desmarcar la respuesta! ¡Ni siquiera puedo calificar tu respuesta en el mes! ¡Pero la publicación fue interesante y útil de todos modos!
Simon Hayward
Algo así como un gráfico dirigido con nodos en cada nivel, dividiéndose. Con cada rama ponderada. El problema es que no sé el nombre de lo que estoy pidiendo, ¡por lo que la pregunta es difícil de responder!
Simon Hayward
2
@SimonHayward, he actualizado con algunos ejemplos más. Parece que la aplicación Conjuntos paralelos tiene el comportamiento que desea en comparación con la aplicación Fineo.
Andy W