Me encuentro cada vez más luchando por definir puntos de ruptura cuando visualizo mapas coropléticos (también conocidos como temáticos) para que otros los vean . ¿Alguien tiene alguna referencia sugerida que ayude a guiar, tanto cómo elegir el tipo de escala utilizada como el número apropiado de puntos de ruptura? En particular, para el número de contenedores, solo he visto argumentos para un número límite (por ejemplo, no debe usar más de 5).
Para ser más específico sobre lo que estoy buscando, la mayoría de las referencias que he encontrado sobre el tema son similares al documento al que hace referencia Julien en esta publicación , y solo estoy buscando una discusión más profunda sobre el tema.
Algunos casos de uso específicos que encuentro con frecuencia (para ejemplos de mis luchas);
- Cuando se muestran datos que tienen un gran sesgo a la derecha, normalmente dudo en mostrar una escala exponencial. Me temo (para el público al que normalmente estoy mostrando mapas) que esto causaría una mayor carga cognitiva al leer la escala y asignar valores de atributos reales a los colores. ¿Son incorrectos mis miedos? También para este tipo de distribuciones me resulta difícil justificar un número particular de contenedores.
- Al mostrar muchos mapas múltiples pequeños, ¿cómo elijo una escala apropiada que permita visualizar las relaciones de manera efectiva tanto dentro como entre los múltiplos pequeños? Mi estándar de facto cuando las escalas de atributos varían en gran medida es usar quintiles dentro de cada distribución separada. ¿Los quintiles son demasiadas clasificaciones y crean una carga cognitiva demasiado grande para comparar entre los paneles? Supongo que las personas entienden que las clasificaciones cuantiles son equivalentes a las clasificaciones (y, por lo tanto, cuando se clasifican de esa manera ayudan a interpretar entre paneles), ¿es correcta esta suposición?
Inicialmente escribí un párrafo tratando de describir los objetivos de dichos mapas, pero sospecho que mis objetivos son bastante típicos, por lo que no fue necesario. Lo único que debo aclarar de nuevo es que estos son para que los vean otras personas (como en informes, publicaciones) y no son realmente para mi propio análisis exploratorio de datos (aunque sospecho que un buen consejo debería traducirse en cualquiera de los dos). Quizás una buena referencia puede describir los objetivos potenciales de dichos mapas y las compensaciones asociadas con el uso de diferentes esquemas de clasificación. Estaría interesado en referencias específicas y generales.
fuente
Respuestas:
Una gran referencia, que no se cita lo suficiente, es "Cómo funcionan los mapas" de Alan M. McEachren (The Guilford Press, 1995/2004). No es una guía rápida, sino una reflexión completa sobre cómo se ven y entienden los mapas, basados en una encuesta científica realmente impresionante y el conocimiento de los profesionales.
fuente
Recientemente compré Cartografía temática y visualización ( Slocum et al., 2005 ), y el simple hecho de leerlo parece ser más que suficiente para mi solicitud de referencias generales sobre el tema de la elección de contenedores. Ciertamente me dará mucho para leer durante bastante tiempo, y no fue una decisión demasiado ardua comprar (hay muchas copias baratas más antiguas flotando).
Tenga en cuenta que no creo que recomendaría cómo funcionan los mapas de MacEachren para esta pregunta en particular. El libro es tan monolítico que podría haberlo olvidado, pero no recuerdo ninguna discusión directa sobre la elección del número de contenedores (al menos no tan sencillo como el capítulo dedicado a él en el libro de texto de Slocum). En todo caso, creo recordar que mencionar el tema está un poco exagerado y no ha llegado a ninguna conclusión real, pero de todos modos lo recomendaría como referencia general para la visualización de datos.
Hay una gran cantidad de literatura sobre el tema, y tendré que estudiar un poco más para ver si puedo encontrar una respuesta más satisfactoria para clasificar la distribución sesgada. Y volveré a publicar si tengo algo más sustantivo que decir.
Pero para la segunda pregunta sobre la visualización de pequeños mapas múltiples, recientemente encontré un artículo de Cynthia Brewer y Linda Pickle, Evaluación de métodos para clasificar datos epidemiológicos en mapas de coropletas en serie (PDF aquí ), que está exactamente dirigido a mi pregunta.
En resumen, los experimentos sugieren que los cuantiles son la forma más útil de representar una serie de pequeños mapas múltiples, tanto por la facilidad de interpretación (como sugerí en la pregunta) como por el hecho de que producen mapas de área igual en términos de relleno cuando los polígonos son aproximadamente del mismo tamaño. Tal vez esto no sea obvio hasta que vea un contraejemplo; a continuación, pegué una imagen de algunos mapas múltiples pequeños en los que las clasificaciones están obligadas a ser iguales en la serie de diferentes tasas de cáncer (en la página 674 del artículo citado).
Debido a que la incidencia de enfermedad hepática es mucho más baja que la EPOC, todos los condados en los mapas superiores tienden a caer en las clasificaciones más bajas. Si no puede discriminar patrones dentro de uno de los mapas, ¡es poco probable que distinga patrones entre mapas! Por supuesto, si es razonable, las clasificaciones deben ser consistentes, pero eso solo es razonable para algunos mapas de comparación. También en cuanto al número de contenedores que eligieron 7 en sus experimentos.
fuente
ver esta ref. Optimización de la selección de varias clases de mapas de coropletas
en
T. Bandrova y col. (eds.), Cartografía temática para la sociedad, Lecture Notes in Geoinformation and Cartography, DOI: 10.1007 / 978-3-319-08180-9_6, Springer International Publishing Switzerland 2014
fuente