Estoy haciendo una visualización de datos. Cada dato está representado por un cuadrado. Para hacer que los datos subyacentes sean legibles intuitivamente, ¿la longitud del lado de cada cuadrado o el área de cada cuadrado debe ser proporcional al dato que representa?
16
Respuestas:
Si usted, el creador, no está seguro, ¿cómo sabrá el lector cuál es?
Respuesta corta: el valor debe estar vinculado 1: 1 a la cantidad de color en la página . Entonces, en su ejemplo, debería ser área. Pero hay más que eso: también debe evitar las señales engañosas que podrían hacer que un lector lo lea incorrectamente, y necesita saber por qué está usando área en lugar de longitud (por ejemplo, gráficos de barras), porque tiene ventajas y desventajas reales.
Primero, nunca cambie tanto la longitud como el ancho (es decir, el área) de una forma cuando en realidad la variable solo está vinculada a la longitud de un lado. Si X es doble Y pero Y tiene cuatro veces más color en la página, está engañando a sus lectores. Este tipo de distorsión a veces se conoce como un " factor de mentira ", y a menudo se supone que es un intento deliberado de inducir a error y exagerar las diferencias.
Si usa el área como medida, le recomiendo encarecidamente:
Saber por qué estás usando área . Al usar el área en lugar de una dimensión lineal como la longitud, usted:
Considere usar círculos para el área, no cuadrados, alineados al centro :
Por ejemplo, arriba, es difícil no ver el cuadrado etiquetado "5" como tres cuartos de la altura del cuadrado etiquetado "10", por lo que es potencialmente engañoso.
Los círculos no invitan a este tipo de comparación: es más como un instante instintivo "Ese blob es bastante más grande que el siguiente blob".
Existe una variedad de evidencia, desde pruebas de usuarios hasta estudios a pequeña escala (tratará de buscar algunos ejemplos más adelante) de que este tipo de comparación intuitiva basada en áreas puede ser más atractiva, puede reducir la barrera de entrada a audiencias menos comprometidas y puede ayuda a mantener el enfoque del lector en el tema en lugar de las frías minucias de los números. Pero esto tiene el costo de obstaculizar un análisis más numérico.
No elija entre una dimensión (longitud o distancia) y dos dimensiones (área) por razones estéticas: elija entre ellas según su audiencia y mensaje.
¿Qué es más apropiado para la comunicación: comparaciones instantáneas a nivel de intestino al nivel de "eso es mucho más grande", o comparaciones numéricas más consideradas al nivel de "eso es aproximadamente el 80% del otro"?
¿O hay razones prácticas por las que necesita usar el área?
Luego, cuando haya elegido por razones prácticas , aplique la estética.
fuente
Yo diría que el área. Ópticamente, un cuadrado con un lado dos veces más largo se muestra como un área 4 veces más grande. Los observadores casuales se relacionarán con el área, incluso sin leer su leyenda.
Un buen ejemplo es este gráfico legendario de Randall Munroe de xkcd :
( versión enorme y legible )
fuente
No somos tan buenos para juzgar las diferencias en el área como lo somos en longitud. Usamos la longitud como proxy y, por lo tanto, tendemos a subestimar las diferencias en las áreas.
Por esta razón, un círculo que en realidad tiene 2x el área de otro parece demasiado pequeño porque nuestro cerebro está relacionando sus radios, que difieren en un factor de 1.4x.
Hay intentos interesantes de conciliar este fenómeno, como el mapeo de símbolos proporcionales en R , que propone una escala perceptiva de los símbolos para alinearse más estrechamente con la forma en que juzgamos las longitudes y las áreas.
Aquí está la Fig. 2 de este artículo
Personalmente no tengo ninguna experiencia con esto y evito usar áreas si se requieren juicios cuantitativos.
Una tangente interesante es la relación entre la percepción del volumen y la longitud. La diferencia en cómo los percibimos es aún más sorprendente. Esto se puede ilustrar en este video de comparaciones de tamaño de estrella .
Cuando llegas a la estrella más grande, que tiene aproximadamente 1.700 veces el diámetro del sol, te queda la impresión de que es mucho más grande que 1,700x.
Para una visión más sistemática de nuestro error al percibir las diferencias en áreas y longitudes, vea Percepción gráfica de Crowdsourcing: Uso de Mechanical Turk para evaluar el diseño de visualización por Jeffrey Heer y Michael Bostock.
fuente
En mi opinión, el área (D), no cada lado (E).
Si está utilizando un lado de longitud 2, entonces el área sería 4 veces el valor y tendría un gráfico muy superpuesto. (MI)
Cuando tiene un gráfico de barras normal (A), los datos son lineales y el valor de la barra es solo por motivos estéticos. (SI)
En esos casos, el área nuevamente es representativa de los datos porque las barras con son las mismas. Puede tener una barra 3D y aún así el volumen de la barra es el que representa los datos (C)
fuente
Tufte se ocupó de esto ampliamente. Ver:
Algunos principios de integridad gráfica:
En su caso, debe preguntarse si los datos están mejor representados por una imagen 2D o 3D o una línea. Un cubo, un cuadrado y una línea no son lo mismo. Esa es una de las razones por las que los gráficos de barras 3D a menudo son engañosos.
fuente