Estoy haciendo un coro para una próxima carrera local usando D3 . Hay dos candidatos que se postulan para una elección. Para cualquier polígono en mi mapa, si el candidato rojo tiene más votos, el color debe ser rojo. Si el candidato azul tiene más votos, el color debe ser azul. Si el candidato azul está ganando mucho, el color debe ser un azul más profundo. Si el candidato rojo está ganando mucho, el color debe ser un rojo más profundo.
¿Debo usar una escala discreta o continua para esto? Es decir, debería crear una rampa de color de rojo a azul para una saturación o intensidad dada. ¿O debería crear contenedores de modo que si el rojo / azul cae en un cierto rango, al polígono se le asigne uno de los pocos colores? De los tutoriales, parece que la mayoría de las personas hacen contenedores.
fuente
Respuestas:
Hay beneficios y desventajas en cada forma de hacerlo. Para resumir, recomendaría crear "contenedores". Un par de notas para ayudarlo a elegir y sobre el diseño de coropletas en general:
Un mapeo directo del valor de los datos al color (un mapa 'no clasificado') podría considerarse la forma más precisa de mostrar los datos, sin embargo, los mapas clasificados (mapas con 'contenedores') pueden ser más legibles por varias razones.
Si usa un mapa no clasificado y los datos están sesgados, o hay valores atípicos en el conjunto de datos, los valores atípicos se destacarán claramente, mientras que muchos de los polígonos pueden terminar en un color muy similar. Esto destacaría el hecho de que algunas áreas son radicalmente diferentes que otras (en su caso, si un par de áreas tenían una preferencia significativamente mayor por un candidato sobre el otro que la mayoría de las áreas), pero es más difícil distinguir las relaciones dentro de El resto del área del mapa.
En un mapa clasificado, cada clase debe ser visualmente distinta, por lo que es fácil saber dónde se encuentra un área en los datos, a costa de que se pierdan algunas de las distinciones más finas.
Otro problema es que la percepción de la intensidad del color no es estrictamente lineal. Entonces, si tuviera una rampa de color de blanco a azul, que corresponde a ningún candidato que reciba más votos para el plomo máximo para un candidato, el color que es el 75% del camino entre el blanco y el azul podría no percibirse como el 75% del entre los dos colores y, por lo tanto, el usuario del mapa haría una suposición falsa sobre qué valor de datos representaba.
Los mapas clasificados, por otro lado, pueden tener el color de cada clase cuidadosamente elegido para ser percibido clara y distintivamente. No sé lo suficiente para diseñar un conjunto de colores que haga esto, pero Cynthia Brewer y Mark Harrower sí, y crearon colorbrewer2.org , una gran herramienta (gratuita) para ayudar a los cartógrafos a elegir buenos esquemas de color para sus mapas. Puede elegir entre una variedad de esquemas, elegir el número de clases, y ofrece una vista previa de cómo se vería el esquema en la práctica, y los valores RBG, HEX o CMYK para cada color en el esquema. Muy útil, y simplemente divertido para jugar.
Por estas razones, recomendaría hacer un mapa clasificado. El número recomendado de clases suele ser un número impar de 5-9 más o menos. El uso de un número impar da un valor promedio distinto, y este número de clases generalmente se considera suficiente para dar distinciones útiles en los datos, pero no demasiados para que no se puedan distinguir. Como está utilizando un esquema de color divergente (color claro en el medio, dos colores diferentes en cada extremo), puede salirse con más clases, tal vez 7-9.
Dirígete a Colorbrewer, elige "divergir" por la naturaleza de tus datos, selecciona el esquema de color rojo a azul, elige tu número de clases y ¡listo!
Para gran parte de esto, no hay una regla estricta. El estándar es, "¿el mapa comunica bien los datos?" Jugar con los parámetros hasta obtener algo que "funcione" puede ser algo bueno.
Ahora, una nota sobre hacer coropletas. Mis disculpas si este es un terreno familiar para usted:
Un punto de interés cuando se usa un mapa clasificado es cómo se dividen los datos en clases. ¿Se rompe a intervalos iguales a lo largo del rango? ¿Se asigna un cierto número de puntos de datos a cada clase? ¿Cierto número de desviaciones estándar de la media? ¿Está roto en las interrupciones "naturales" en los datos? El método que use marca la diferencia en cómo se representan los datos. No soy un gran programador, y no estoy seguro de qué método utiliza el script que vincula. Los "descansos naturales" suelen ser una buena opción. Para datos con un punto medio claro como datos de sondeo (el punto medio es una división 50/50), las desviaciones estándar pueden ser útiles.
Al hacer un coropleta, es bueno usar datos estandarizados sobre una unidad de área. Por ejemplo, en lugar de utilizar la población total en un condado, es mejor mapear la población por milla cuadrada en cada condado. La razón es que un área más grande tenderá a tener más personas en ella que una más pequeña, por lo que dividir por el área de cada unidad mapeada proporciona una descripción más precisa de las tendencias. Los datos también se pueden estandarizar como un porcentaje. Por ejemplo, una tasa de pobreza en lugar de un número de personas en la pobreza.
Para sus propósitos, es más revelador mapear el porcentaje de votos emitidos para un candidato que el número bruto de votos emitidos para ese candidato.
De todos modos, espero que algo de esto sea útil, ¡y que tu mapa salga bien!
Para gran parte de esta discusión, recurrí a Cartografía temática y geovisualización de Slocum et al.
fuente
Aborda uno de los muchos aspectos de la simbolización : cómo representar los valores cuantitativos a través de una representación de color variable, utilizando una escala discreta o continua de saturación o intensidad de color. Buena pregunta. La respuesta es, como a menudo, depende ...
La cartografía temática tradicional reconoce que los mapas, como modelos simplificados de la realidad, son producto de una gran cantidad de generalización. En aras de la simplicidad, las cantidades se agrupan en clases (contenedores), y ha habido muchas discusiones sobre cuántas clases deberían existir (5 o 7 a menudo se promocionaban). Las ventajas: mucho más simple de construir utilizando métodos fotomecánicos tradicionales y más fácil de transmitir el mensaje. Mira, aquí Red Ken es favorecido, mientras que allá, Blue Peter.
La cartografía temática contemporánea permite mapas de mucho mayor detalle donde las cantidades continuas se pueden representar mediante escalas de color de muy altos rangos. Las ventajas: más objetivas y detalladas. Los lectores de mapas pueden potencialmente recrear los datos de origen con más precisión.
Entonces, ¿cuál es el propósito más profundo de su mapa?
¿Desea ser más objetivo al explorar las variaciones detalladas presentes en los datos? Usa las escalas de color continuas. Este concepto de "mapa como herramienta de investigación" viene con nombres (nuevos) como "visualización de datos" y "mapeo de calor".
¿Quieres contar una historia simple? Use escalas de color discretas. Este es el "mapa como herramienta de comunicación".
Dado que su mapa ya está muy generalizado espacialmente, en regiones de votación, podría sugerir el uso de escalas de color continuas como compromiso: tiene discretización espacial pero continuidad estadística. Solo una idea.
En última instancia, depende de usted. ¿Por qué no experimentar con algunas variaciones?
fuente
Veo dos opciones:
a) solo usa contenedores: (los números son solo un ejemplo)
b) usa una rampa de color.
Lo que elegiste depende de lo que quieras comunicar con el mapa. Si la información "está ganando" y "está ganando xy%" es suficiente, elija a). Si sus lectores deben poder estimar cuántos% de candidato rojo o azul lidera, elija b)
fuente