Visualización efectiva de datos demográficos en un mapa impreso

29

Me gustaría trazar los siguientes datos por zona (30 zonas en total) en un mapa imprimible / no interactivo:

  • Edad promedio
  • Ingreso Promedio del Hogar
  • Numero de hogares
  • Densidad de población
  • Número de personas
  • Numero de trabajadores

¿Cómo mostrarías las 6 capas anteriores de manera efectiva en un mapa?

dassouki
fuente
1
¿Qué tan grandes son las zonas en relación con el tamaño de la página? ¿Puedes colocar una pequeña parcela en cada zona? (por ejemplo, un gráfico de radar)
djq
@celenius -Es un tipo de encuesta censal típica, donde las zonas del centro son mucho más pequeñas que las zonas residenciales que son significativamente más pequeñas que las zonas suburbanas / rurales
dassouki
1
Estas 6 capas en un mapa estático es un trabajo de diseño difícil. ¿Cuál es el problema que impide el uso de un mapa interactivo?
Trevesy
@Trevesy: en su mayor parte, el requisito es diseñar un mapa imprimible que resalte las 6 variables para promover el análisis visual
dassouki
1
Me tomé la libertad de agregar la etiqueta de visualización, siéntase libre de eliminarla si cree que es inapropiada.
Andy W

Respuestas:

20

Diría que no puede incluir todos esos datos en un mapa y que tenga sentido. Te recomiendo que pienses en la línea del principio de Tufte de pequeños múltiplos, que tienen múltiples mapas más pequeños de la misma área, cada uno con una variable diferente. Ejemplo: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Incluso entonces, tiene el problema de que está utilizando un montón de unidades diferentes, por lo que necesita un montón de claves. Otra forma de ver los datos (pero no en un mapa) sería usar una tabla con todos los valores, coloreados (es decir, diferentes colores para debajo del promedio, promedio, sobre el promedio)

También le recomendaría que consulte el atlas del censo para obtener más ideas de mapas: http://www.census.gov/population/www/cen2000/censusatlas/

Podría ayudar a reflexionar más sobre qué mensaje está tratando de comunicar, exactamente (no solo qué datos tiene).

Neuhausr
fuente
55
+1 Esto es mucho mejor que hacer un desastre al intentar simbolizar seis variables a la vez. Además, ¿por qué no imprimir una tabla de datos? Seis columnas + id, 30 filas: es lo suficientemente pequeño y ofrece todos los detalles que cualquiera necesitaría.
whuber
13

No es posible mostrar eficientemente tantos datos en un solo mapa. Dos posibilidades:

  • Produce 6 mapas,

  • Analice sus datos para clasificar sus regiones y muestre el resultado de la clasificación. Un análisis de componentes principales puede ayudar a determinar las correlaciones más importantes dentro de su variable. Este método se ha utilizado para producir este mapa sintético:

texto alternativo

de estos:

texto alternativo texto alternativo

julien
fuente
El problema con tener 6 mapas es que es difícil determinar visualmente cualquier tendencia. A veces, es agradable mirar un mapa con múltiples variables y ver cómo se alinean las cosas
dassouki
2
@dassouki, para ver cómo se alinean las cosas, no necesariamente necesitas mapearlas. Los diagramas de dispersión bivariados cumplirían con ese criterio y serían mucho más fáciles de interpretar.
Andy W
3
¡La ventaja de tener 6 mapas es que es fácil identificar visualmente las tendencias! Cuando intenta agrupar seis (o más) variables en un solo mapa, puede resultar difícil encontrar patrones. (Sin embargo, si este mapa involucrara miles de características, cambiaría este comentario: ciertos tipos de mapeo, como la visualización de glifos , pueden ser notablemente efectivos para encontrar patrones en conjuntos de datos ricamente multivariados: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@julien, cosas geniales, puede que te interese este artículo que acabo de encontrar, e-publications.org/ims/submission/index.php/AOAS/user/… , tiene mapas con análisis PCA asociado de múltiples variantes similares datos, así como el código R para hacer los gráficos.
Andy W
Realmente interesante, tendré que leer sobre esto.
neuhausr
9

Estoy de acuerdo en que los múltiplos pequeños son probablemente una buena forma de abordar este problema. Para complementar el mapa, también sugeriría una matriz de diagrama de dispersión de sus variables, que identificaría correlaciones bivariadas. Si bien pierde el aspecto geográfico de sus datos, es mucho más sencillo visualizar las relaciones entre las variables en un diagrama de dispersión que comparar dos mapas (incluso uno al lado del otro).

Si aún desea capturar algún tipo de tendencias espaciales, puede incluir estadísticas espaciales (como la I de Moran local) entre las distribuciones y / o las variables originales.

Editar: Recientemente me encontré con un trabajo que revisa las estadísticas morales publicadas por Andre-Michel Guerry (originalmente en 1883) que tiene el objetivo de visualizar relaciones multivariadas en el espacio. Las implementaciones de esos autores son muy similares a lo sugerido en este hilo, pequeños múltiplos, análisis de componentes principales, matrices de gráficos de dispersión y dentro de diagramas de polígonos. Se adjuntan algunas fotos de A.-M. Estadísticas morales de Guerry de Francia: desafíos para el análisis espacial multivariable por: Michael Friendly Statistical Science, vol. 22, núm. 3. (agosto de 2007), págs. 368-399 (El PDF es gratuito). También otro artículo ( Dray y Jombart, 2010 ) analiza los mismos datos y tiene algún código fuente en R para hacer dichos trazados.

Una imagen es una matriz de diagrama de dispersión, la otra es lo que se llama diagrama de estrella (que es solo una forma diferente de representar gráficos de barras como sugirió Pablo). texto alternativo texto alternativo

Andy W
fuente
8

Aquí hay un maravilloso ejemplo de pequeños múltiplos publicados en Andrew Gelman (y el blog de la compañía) Modelización estadística, inferencia causal y ciencias sociales . El mapa es de apoyo electoral para los cupones escolares por estado, condicionado a los ingresos y a varias categorías de raza y religión. ¡A los no evangélicos blancos realmente no les gustan los vales escolares! (Si va al blog real, aunque aparece en los datos de la encuesta de 2004, hay más apoyo para los cupones escolares entre ese grupo). ingrese la descripción de la imagen aquí

Andy W
fuente
El gráfico es genial, pero la escala de colores es horrible. ¿Por qué se prioriza el 50% al hacerlo gris? ¿Seguramente debería usar colores de mapa de calor, o algo así? Además, ¿por qué solo las personas se dividen en religión? ¿Seguramente tendría más sentido dividirse por raza y luego por religión?
naught101
@ naught101, estoy un poco confundido por tu negatividad. Seguramente el gris se enfatiza en comparación con los colores más brillantes u oscuros en cualquier extremo del espectro. Si bien me niego a que arbitrariamente diverjan al 45%, la OMI al hacer pequeños mapas múltiples como estos es beneficioso tener valores altamente contrastantes. El comentario sobre las divisiones de religión / raza no tiene mucho sentido tampoco en la OMI. Estas son categorías que obviamente están muy relacionadas con si un individuo admite cupones, y parece que algunos de los subconjuntos que sugiere no existen. cont ...
Andy W
Es decir, dudo mucho que existan suficientes "católicos negros" en la encuesta para decir algo sustantivo sobre ese grupo (ni "protestantes hispanos no evanguales"). Le sugiero que lea la publicación de Gelman y espero que eso aclare la motivación para los subgrupos.
Andy W
tal vez es solo ese gris particular que sobresale en mi pantalla. Creo que sería mejor con el blanco, y tal vez un fondo gris para distinguirlo. También vale la pena señalar que las dos imágenes en el blog de Gelman tienen escalas diferentes ... Tenía la impresión de que la población negra era mucho más alta, pero solo miré los datos del censo y me corrigí. Sin embargo, una cosa extraña es que el censo define el origen hispano como ortogonal a la raza (es una pregunta separada). Creo que las distinciones de Gelman se definen de manera diferente ..
naught101
@ naught101 esto no es información del censo, es de alguna otra encuesta (el censo no tiene nada de opinión pública)
Andy W
5

Para elegir entre las soluciones presentadas aquí, puede proporcionar dos informaciones clave:

  • ¿Cuál es el propósito del mapa? (¿Descubrir, exponer?)
  • ¿Cuál es el público previsto del mapa? (¿Ustedes, colegas analistas, urbanistas, públicos?)

Las soluciones citadas aquí pueden tener una eficiencia diferente según el propósito y el público.

Me gustaría generalizar la respuesta de Julien (un mapa sintético a través de un PCA) citando la técnica de diagonalización de la matriz, descrita por J. Bertin. Es útil cuando se busca una síntesis de toda la información, en lugar de una presentación completa de datos.

En resumen, consiste en representar cada variable con un histograma, ordenar y apilar los histogramas de tal manera que los valores (las zonas del mapa) estén alineados en diagonal, para obtener una tipología:

texto alternativo

(Fuente: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
fuente
4

Esa es una gran cantidad de información y es un hecho que un solo mapa que los combine de manera temática resultaría en una presentación inútil debido a la contaminación visual. Por otro lado, hay 30 zonas, por lo que muchos mapas para cada zona también darían lugar a la contaminación.

Mi solución: elija cuál es la información más importante, digamos 'ingresos del hogar', luego ubique el mapa en algunas categorías de ingresos. Y, por último, para cada lugar de ingresos, trazar una barra de chat con los otros 5 atributos.

Con ese mapa se pueden hacer algunas comparaciones como, por ejemplo: "Las áreas de altos ingresos siempre muestran un gran número de trabajadores y una edad promedio de más de 21 años".

Mira el ejemplo...

texto alternativo

Pablo
fuente
4

¿Quizás algunas de estas ideas podrían ayudar?

Suponiendo que tiene seis dimensiones:

1: Choropleth : ejemplo de ingresos del hogar 0

2, 3 y 4: Símbolos : Representa el número de personas como puntos, lo que puede permitirle ver el fondo: ejemplo 1, ejemplo 2 usando escala de grises para trabajadores / no trabajadores y un esquema de color diferente para mostrar la edad

5: 3D : uso de la densidad de población como ejemplo de terreno 3

6: (¡No puedo pensar en una sexta forma!)

¿Es redundante mostrar 'Número de hogares', 'Densidad de población' y 'Número de personas'?

Sería escéptico si un mapa con esta complejidad fuera claro para alguien además de usted. Si lo presentara, primero mostraría cada elemento por separado y luego lo agregaría para que la audiencia pueda entender los pasos.


Una forma alternativa (si no tiene espacio para un gráfico de radar para cada zona, podría ser crear un 'glifo' que represente este ejemplo de información 4, figura 10.28 . Creo que estos son generalmente difíciles de entender y no fáciles de diseñar claramente, pero el ejemplo vinculado podría usarse en este caso.


Otro pensamiento que tuve fue extruir los polígonos a la misma altura para cada polígono y luego usar una sección de la altura para representar estos parámetros. Similar a hacer un gráfico de barras para cada área, pero donde cada sección está en capas en la parte superior a intervalos similares. Esto debería verse desde 3D, lo que significaría que parte de él quedaría oculto.

djq
fuente
Me encanta, y me refiero a todas sus sugerencias. Planeo implementar 1-> 4. Sin embargo, para las cosas en 3D: encuentro que cuando haces mapas en 3D, las áreas del centro, generalmente ubicadas en el centro, obtienen la mayor parte de la elevación, bloqueando muchas zonas detrás de ellas
dassouki
@dassouki: estoy de acuerdo en que ese suele ser el caso. Quizás podría usar una variable que no tenga un rango enorme para esto (¿edad promedio?), O si lo tiene, podría transformarlo logarítmicamente.
djq
3
@celenius Pregunta interesante sobre la posible redundancia: la densidad de población es el número de personas en relación con el área ; el número de personas es un recuento absoluto ; y el número de hogares proporciona información sobre cómo viven juntas las personas. Aunque claramente estas tres variables están relacionadas (y pueden crear problemas de casi colinealidad en las regresiones), en realidad son tres piezas diferentes de información. Por cierto, es "coropleth". (Afortunadamente, Google reconoce este error tipográfico y realiza la búsqueda prevista de todos modos.)
whuber
1
@whuber - Creo que probablemente se haga usando flash (¡tristemente!).
djq
2
Sospecho mucho de la sugerencia de 3D. AFAIK nadie ha demostrado que 3D sea muy útil. El vínculo con el crimen de San Francisco funciona, pero solo porque es muy simple: un patrón más complejo sería difícil de descifrar. No creo que 3D sea el camino a seguir en este caso.
Trevesy
2

Es una tarea desafiante. Mi respuesta es ir con un mapa multivariante. Mira este mapa . El mapa se verá ocupado si muestra todas las variables en un mapa. Asegúrese de seleccionar el esquema de color apropiado si elige ir con un mapa multivariado.

Raj
fuente
Google Docs está bloqueado donde trabajo :(
dassouki
tampoco funcionó y no puedo rasparlo si no tiene una extensión de archivo al final
dassouki
Todavía no voy ....
dassouki
Está a una cuadra de mi lado. :( No me importa enviarte el mapa por correo electrónico.
Raj
0

Un grado de simplificación sería expresar un elemento, como la densidad de población, a través de un cartograma, es decir, distorsionar el área de cada unidad para que sea proporcional a la población:

Elección presidencial estadounidense de 2008
(fuente: amherst.edu )

El principal inconveniente es que el espectador debe ser capaz de reconocer la distorsión de las zonas de sus formas "habituales".

Más información aquí: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
fuente
1
Creo que esto tiene potencial, pero no está claro qué tan bien se pueden aplicar los cartogramas a esta situación particular (ver simultáneamente múltiples atributos en el mismo espacio). Teóricamente, podrías hacer muchos cartogramas múltiples pequeños, pero puede ser difícil de interpretar (pierdes la consistencia entre los mapas, lo cual es esencial para los múltiplos pequeños). Quizás el cartograma se pueda combinar con el color de formas más interesantes para mostrar múltiples atributos.
Andy W
1
Un ejemplo de pequeños cartogramas múltiples, gisandscience.com/2011/12/07/…
Andy W