Me gustaría trazar los siguientes datos por zona (30 zonas en total) en un mapa imprimible / no interactivo:
- Edad promedio
- Ingreso Promedio del Hogar
- Numero de hogares
- Densidad de población
- Número de personas
- Numero de trabajadores
¿Cómo mostrarías las 6 capas anteriores de manera efectiva en un mapa?
cartography
visualisation
dassouki
fuente
fuente
Respuestas:
Diría que no puede incluir todos esos datos en un mapa y que tenga sentido. Te recomiendo que pienses en la línea del principio de Tufte de pequeños múltiplos, que tienen múltiples mapas más pequeños de la misma área, cada uno con una variable diferente. Ejemplo: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/
Incluso entonces, tiene el problema de que está utilizando un montón de unidades diferentes, por lo que necesita un montón de claves. Otra forma de ver los datos (pero no en un mapa) sería usar una tabla con todos los valores, coloreados (es decir, diferentes colores para debajo del promedio, promedio, sobre el promedio)
También le recomendaría que consulte el atlas del censo para obtener más ideas de mapas: http://www.census.gov/population/www/cen2000/censusatlas/
Podría ayudar a reflexionar más sobre qué mensaje está tratando de comunicar, exactamente (no solo qué datos tiene).
fuente
No es posible mostrar eficientemente tantos datos en un solo mapa. Dos posibilidades:
Produce 6 mapas,
Analice sus datos para clasificar sus regiones y muestre el resultado de la clasificación. Un análisis de componentes principales puede ayudar a determinar las correlaciones más importantes dentro de su variable. Este método se ha utilizado para producir este mapa sintético:
de estos:
fuente
Estoy de acuerdo en que los múltiplos pequeños son probablemente una buena forma de abordar este problema. Para complementar el mapa, también sugeriría una matriz de diagrama de dispersión de sus variables, que identificaría correlaciones bivariadas. Si bien pierde el aspecto geográfico de sus datos, es mucho más sencillo visualizar las relaciones entre las variables en un diagrama de dispersión que comparar dos mapas (incluso uno al lado del otro).
Si aún desea capturar algún tipo de tendencias espaciales, puede incluir estadísticas espaciales (como la I de Moran local) entre las distribuciones y / o las variables originales.
Editar: Recientemente me encontré con un trabajo que revisa las estadísticas morales publicadas por Andre-Michel Guerry (originalmente en 1883) que tiene el objetivo de visualizar relaciones multivariadas en el espacio. Las implementaciones de esos autores son muy similares a lo sugerido en este hilo, pequeños múltiplos, análisis de componentes principales, matrices de gráficos de dispersión y dentro de diagramas de polígonos. Se adjuntan algunas fotos de A.-M. Estadísticas morales de Guerry de Francia: desafíos para el análisis espacial multivariable por: Michael Friendly Statistical Science, vol. 22, núm. 3. (agosto de 2007), págs. 368-399 (El PDF es gratuito). También otro artículo ( Dray y Jombart, 2010 ) analiza los mismos datos y tiene algún código fuente en R para hacer dichos trazados.
Una imagen es una matriz de diagrama de dispersión, la otra es lo que se llama diagrama de estrella (que es solo una forma diferente de representar gráficos de barras como sugirió Pablo).
fuente
Aquí hay un maravilloso ejemplo de pequeños múltiplos publicados en Andrew Gelman (y el blog de la compañía) Modelización estadística, inferencia causal y ciencias sociales . El mapa es de apoyo electoral para los cupones escolares por estado, condicionado a los ingresos y a varias categorías de raza y religión. ¡A los no evangélicos blancos realmente no les gustan los vales escolares! (Si va al blog real, aunque aparece en los datos de la encuesta de 2004, hay más apoyo para los cupones escolares entre ese grupo).
fuente
Para elegir entre las soluciones presentadas aquí, puede proporcionar dos informaciones clave:
Las soluciones citadas aquí pueden tener una eficiencia diferente según el propósito y el público.
Me gustaría generalizar la respuesta de Julien (un mapa sintético a través de un PCA) citando la técnica de diagonalización de la matriz, descrita por J. Bertin. Es útil cuando se busca una síntesis de toda la información, en lugar de una presentación completa de datos.
En resumen, consiste en representar cada variable con un histograma, ordenar y apilar los histogramas de tal manera que los valores (las zonas del mapa) estén alineados en diagonal, para obtener una tipología:
(Fuente: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )
fuente
Esa es una gran cantidad de información y es un hecho que un solo mapa que los combine de manera temática resultaría en una presentación inútil debido a la contaminación visual. Por otro lado, hay 30 zonas, por lo que muchos mapas para cada zona también darían lugar a la contaminación.
Mi solución: elija cuál es la información más importante, digamos 'ingresos del hogar', luego ubique el mapa en algunas categorías de ingresos. Y, por último, para cada lugar de ingresos, trazar una barra de chat con los otros 5 atributos.
Con ese mapa se pueden hacer algunas comparaciones como, por ejemplo: "Las áreas de altos ingresos siempre muestran un gran número de trabajadores y una edad promedio de más de 21 años".
Mira el ejemplo...
fuente
¿Quizás algunas de estas ideas podrían ayudar?
Suponiendo que tiene seis dimensiones:
1: Choropleth : ejemplo de ingresos del hogar 0
2, 3 y 4: Símbolos : Representa el número de personas como puntos, lo que puede permitirle ver el fondo: ejemplo 1, ejemplo 2 usando escala de grises para trabajadores / no trabajadores y un esquema de color diferente para mostrar la edad
5: 3D : uso de la densidad de población como ejemplo de terreno 3
6: (¡No puedo pensar en una sexta forma!)
¿Es redundante mostrar 'Número de hogares', 'Densidad de población' y 'Número de personas'?
Sería escéptico si un mapa con esta complejidad fuera claro para alguien además de usted. Si lo presentara, primero mostraría cada elemento por separado y luego lo agregaría para que la audiencia pueda entender los pasos.
Una forma alternativa (si no tiene espacio para un gráfico de radar para cada zona, podría ser crear un 'glifo' que represente este ejemplo de información 4, figura 10.28 . Creo que estos son generalmente difíciles de entender y no fáciles de diseñar claramente, pero el ejemplo vinculado podría usarse en este caso.
Otro pensamiento que tuve fue extruir los polígonos a la misma altura para cada polígono y luego usar una sección de la altura para representar estos parámetros. Similar a hacer un gráfico de barras para cada área, pero donde cada sección está en capas en la parte superior a intervalos similares. Esto debería verse desde 3D, lo que significaría que parte de él quedaría oculto.
fuente
Es una tarea desafiante. Mi respuesta es ir con un mapa multivariante. Mira este mapa . El mapa se verá ocupado si muestra todas las variables en un mapa. Asegúrese de seleccionar el esquema de color apropiado si elige ir con un mapa multivariado.
fuente
Un grado de simplificación sería expresar un elemento, como la densidad de población, a través de un cartograma, es decir, distorsionar el área de cada unidad para que sea proporcional a la población:
(fuente: amherst.edu )
El principal inconveniente es que el espectador debe ser capaz de reconocer la distorsión de las zonas de sus formas "habituales".
Más información aquí: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf
fuente