De ninguna manera soy bueno en estadística, pero creo que he venido al lugar correcto. Mi pregunta es simple:
Mi problema consiste en comparar la población de varios estados en un país pequeño, pero algunos estados tienen una población de 3000,000 y algunos una población de 2,000.
Lo estoy pintando en un mapa, y la "intensidad" del color depende de cómo se compara la población de cada estado con la población de todo el país.
El problema es que los estados con mucha población se muestran con colores realmente intensos y los estados pequeños apenas tienen color.
¿Hay una manera fácil de "normalizar" o hacer que los datos sean comparables?
No sé si me estoy explicando adecuadamente, pero espero que alguien pueda ayudarme. Comente si mi pregunta no es clara y aclararé.
¡Gracias por tu ayuda!
fuente
Respuestas:
Lo siento, pero para mí parece que estás tratando de arreglar lo que no está roto. De hecho, incluso podrías estar tratando de romper lo que no está roto. Cuando tiene una variable cuantitativa (aquí, población) que abarca un amplio rango, entonces cualquier métrica que use para representarla también debe abarcar un amplio rango.
Pero para todas las cosas relacionadas con el color (y especialmente los mapas), la fuente clave es, creo, ColorBrewer
fuente
Buena pregunta, una solución es reescalar los colores para que estén distribuidos de manera más uniforme, o para una distribución con colas más bajas ... pero entonces su leyenda tiene que ser lo suficientemente clara porque deformar la escala, de alguna manera, es injusto ...
Por ejemplo, en R, reescalando un normal a un uniforme. (lo que tienes quizás sea más al revés ya que tienes colas grandes y quieres que sean más pequeñas, pero el principio es el mismo)
fuente
Podrías dividir por la población total. Esto aseguraría que todo se encuentre entre 0 y 1. Si las escalas siguen siendo muy dispares, considere una escala logarítmica.
fuente
Me siento incómodo preguntándolo, pero ¿estás realmente comprometido a usar el color para representar una cantidad cuantitativa? ¿No hay forma de poner una barra en cada estado, cuya altura representa la cantidad?
Otra forma podría ser mostrar el mapa con áreas que representen las áreas geográficas, junto con un mapa donde el área de cada estado sea proporcional al tamaño de la población, de forma similar a como lo hace el homúnculo sensorial . Pero eso sería una cantidad dolorosa de dibujo: no conozco ninguna forma de automatizar eso (aunque puede existir)
fuente
Su objetivo declarado:
Su problema declarado:
Objetivo de normalizar sus datos antes de mapear
Esta respuesta será deficiente ya que no estoy seguro del contexto de por qué está haciendo el mapa.
Sin embargo, aquí hay algunas ideas para explorar: Normalice sus datos para que el mapa proporcione un significado interesante a los lectores potenciales del mapa, para que puedan vincular lo que ven en su mapa con algún concepto en el que normalmente piensan. Básicamente, creo que sus nuevos números normalizados deberían estar vinculados a algún concepto cualitativo que los lectores de mapas encuentren interesante de entender (tidbit aleatorio: Medida = Cantidad x Calidad, Hegel).
Dos formas propuestas para normalizar sus datos
1. Para dar una idea de cuánto espacio abierto hay en cada estado.
Cree una nueva variable de estado para la densidad de población calculando la población dividida por el área total del estado.
2. Para que el color de los estados contraste entre sí.
Cree una nueva variable de estado calculando la desviación de la media de cada estado. Por ejemplo, supongamos que tiene 3 estados con poblaciones de la siguiente manera:
La media será de unos 50.
Los valores de la nueva variable para cada estado serán los siguientes:
Puede usar cualquier combinación de colores donde los números positivos contrasten con los negativos (google 'colorbrewer' para muchos ejemplos de combinaciones de colores para mapas).
fuente