¿Debería el área o la longitud de un cuadrado ser proporcional a los datos que se visualizan?

16

Estoy haciendo una visualización de datos. Cada dato está representado por un cuadrado. Para hacer que los datos subyacentes sean legibles intuitivamente, ¿la longitud del lado de cada cuadrado o el área de cada cuadrado debe ser proporcional al dato que representa?

dumbledad
fuente
1
Aún no. ¿Es amplio? Esperaba que la respuesta fuera definitiva (supongo que es "área"), pero esa gente aquí tendría más diseño gráfico y conocimiento de psicología perceptiva para respaldar eso.
dumbledad
1
IIRC esto fue cubierto en un libro alemán que leí una vez, "So lügt man mit Statistik" por en.wikipedia.org/wiki/Walter_Krämer - no estoy seguro si hay un equivalente en inglés. TL; DR: depende de lo que desea que lean sus lectores de las visualizaciones.
Michael Schumacher
La respuesta ciertamente no es definitiva. Todo depende de detalles específicos, es decir, cuáles son los datos que presenta, cómo los presenta y qué desea comunicar con dichos datos.
DA01
¿Puede dar ejemplos en los que los detalles o lo que queremos que lean los lectores de la visualización nos lleve a elegir hacer que la longitud del lado de un cuadrado sea proporcional al dato en lugar del área del cuadrado?
dumbledad
55
+1 ¿Por qué cada pregunta interesante atrae al menos un voto cerrado? <grump>
user56reinstatemonica8

Respuestas:

10

Si usted, el creador, no está seguro, ¿cómo sabrá el lector cuál es?

Respuesta corta: el valor debe estar vinculado 1: 1 a la cantidad de color en la página . Entonces, en su ejemplo, debería ser área. Pero hay más que eso: también debe evitar las señales engañosas que podrían hacer que un lector lo lea incorrectamente, y necesita saber por qué está usando área en lugar de longitud (por ejemplo, gráficos de barras), porque tiene ventajas y desventajas reales.


Primero, nunca cambie tanto la longitud como el ancho (es decir, el área) de una forma cuando en realidad la variable solo está vinculada a la longitud de un lado. Si X es doble Y pero Y tiene cuatro veces más color en la página, está engañando a sus lectores. Este tipo de distorsión a veces se conoce como un " factor de mentira ", y a menudo se supone que es un intento deliberado de inducir a error y exagerar las diferencias.

ingrese la descripción de la imagen aquí


Si usa el área como medida, le recomiendo encarecidamente:

  • Saber por qué estás usando área . Al usar el área en lugar de una dimensión lineal como la longitud, usted:

    • Sacrifica la capacidad de ver claramente las diferencias matemáticamente (no puedes decir fácilmente "mira, eso es el doble del otro")
    • Invite a sus lectores a verlo de manera intuitiva, cotidiana y no numérica, de la misma manera que las personas, por ejemplo, comparan tamaños de tartas en una tienda. Menos sofisticado, pero más inmediato. Más intestino, menos cabeza.
    • Pequeñas diferencias entre números muy similares se vuelven casi invisibles.
    • Cuando una variable es muchas veces más pequeña que otra, la muy pequeña no desaparece tan mal como lo haría en un gráfico de barras, lo que puede permitir una mayor flexibilidad en los diseños.

ingrese la descripción de la imagen aquí

  • Considere usar círculos para el área, no cuadrados, alineados al centro :

    • Círculos porque no invita a la confusión con gráficos de barras y similares. La altura y el ancho son menos importantes: parece que estás invitando a una comparación basada en la altura o el ancho.
    • Alineado al centro porque no invita a las personas a comparar alturas

ingrese la descripción de la imagen aquí

Por ejemplo, arriba, es difícil no ver el cuadrado etiquetado "5" como tres cuartos de la altura del cuadrado etiquetado "10", por lo que es potencialmente engañoso.

Los círculos no invitan a este tipo de comparación: es más como un instante instintivo "Ese blob es bastante más grande que el siguiente blob".


Existe una variedad de evidencia, desde pruebas de usuarios hasta estudios a pequeña escala (tratará de buscar algunos ejemplos más adelante) de que este tipo de comparación intuitiva basada en áreas puede ser más atractiva, puede reducir la barrera de entrada a audiencias menos comprometidas y puede ayuda a mantener el enfoque del lector en el tema en lugar de las frías minucias de los números. Pero esto tiene el costo de obstaculizar un análisis más numérico.

No elija entre una dimensión (longitud o distancia) y dos dimensiones (área) por razones estéticas: elija entre ellas según su audiencia y mensaje.

¿Qué es más apropiado para la comunicación: comparaciones instantáneas a nivel de intestino al nivel de "eso es mucho más grande", o comparaciones numéricas más consideradas al nivel de "eso es aproximadamente el 80% del otro"?

¿O hay razones prácticas por las que necesita usar el área?

Luego, cuando haya elegido por razones prácticas , aplique la estética.

user56reinstatemonica8
fuente
El 'proporcional a la cantidad de color en la página' es una regla práctica muy útil (al menos en 2D); gracias por eso lo usaré. El diseño al que me estoy mudando se basa en círculos, creo que estás justo ahí
dumbledad
5

Yo diría que el área. Ópticamente, un cuadrado con un lado dos veces más largo se muestra como un área 4 veces más grande. Los observadores casuales se relacionarán con el área, incluso sin leer su leyenda.

Un buen ejemplo es este gráfico legendario de Randall Munroe de xkcd :

ingrese la descripción de la imagen aquí ( versión enorme y legible )

Vincent
fuente
4

No somos tan buenos para juzgar las diferencias en el área como lo somos en longitud. Usamos la longitud como proxy y, por lo tanto, tendemos a subestimar las diferencias en las áreas.

Por esta razón, un círculo que en realidad tiene 2x el área de otro parece demasiado pequeño porque nuestro cerebro está relacionando sus radios, que difieren en un factor de 1.4x.

Hay intentos interesantes de conciliar este fenómeno, como el mapeo de símbolos proporcionales en R , que propone una escala perceptiva de los símbolos para alinearse más estrechamente con la forma en que juzgamos las longitudes y las áreas.

Aquí está la Fig. 2 de este artículo

ingrese la descripción de la imagen aquí

Personalmente no tengo ninguna experiencia con esto y evito usar áreas si se requieren juicios cuantitativos.

Una tangente interesante es la relación entre la percepción del volumen y la longitud. La diferencia en cómo los percibimos es aún más sorprendente. Esto se puede ilustrar en este video de comparaciones de tamaño de estrella .

Cuando llegas a la estrella más grande, que tiene aproximadamente 1.700 veces el diámetro del sol, te queda la impresión de que es mucho más grande que 1,700x.

Para una visión más sistemática de nuestro error al percibir las diferencias en áreas y longitudes, vea Percepción gráfica de Crowdsourcing: Uso de Mechanical Turk para evaluar el diseño de visualización por Jeffrey Heer y Michael Bostock.

Martin Krzywinski
fuente
4

En mi opinión, el área (D), no cada lado (E).

Si está utilizando un lado de longitud 2, entonces el área sería 4 veces el valor y tendría un gráfico muy superpuesto. (MI)

Cuando tiene un gráfico de barras normal (A), los datos son lineales y el valor de la barra es solo por motivos estéticos. (SI)

En esos casos, el área nuevamente es representativa de los datos porque las barras con son las mismas. Puede tener una barra 3D y aún así el volumen de la barra es el que representa los datos (C)

Gráficos que ilustran las diferencias de percepción de tamaño y la superposición

Rafael
fuente
¿4 veces? ¿No es la diferencia entre lineal y cuadrado?
dumbledad
Déjame ilustrar y editar la publicación.
Rafael
Suponga que el dato es 81. Si usamos el área, los lados tienen una longitud de 9, dando un área de 81. Si hacemos lados, entonces tienen una longitud de 81 y el área es de 6.561. 81 no es 4 veces 9 y 6.561 no es 4 veces 81. ¿De dónde sacas 4?
dumbledad
"Si está usando un lado de longitud 2, entonces el área sería 4 veces el valor" No puedo decir qué está tratando de decir allí. Creo que quiere decir que, si usa la longitud del lado para representar la magnitud de los datos, duplicar el valor de los datos multiplica el área por cuatro.
David Richerby
David: ¡esa es mi edición! La publicación original de Rafael decía "si estás usando un lado, el área sería 4 veces el valor". Si conoce una mejor manera de aclarar eso, por favor hágalo.
dumbledad
1

Tufte se ocupó de esto ampliamente. Ver:

  • La visualización de información cuantitativa,
  • Visualizando información y otros.

Algunos principios de integridad gráfica:

  1. La representación de los números, medidos físicamente en la superficie del gráfico, debe ser directamente proporcional a las cantidades numéricas representadas.
  2. Se debe utilizar un etiquetado claro, detallado y completo para vencer la distorsión gráfica y la ambigüedad. Escriba explicaciones de los datos en el gráfico mismo. Etiquete eventos importantes en los datos.
  3. Mostrar variación de datos, no variación de diseño.
  4. En las exhibiciones de dinero en series temporales, las unidades de medida monetaria desinfladas y estandarizadas son casi siempre mejores que las unidades nominales.
  5. El número de dimensiones portadoras de información (variables) representadas no debe exceder el número de dimensiones en los datos. Los gráficos no deben citar datos fuera de contexto.

En su caso, debe preguntarse si los datos están mejor representados por una imagen 2D o 3D o una línea. Un cubo, un cuadrado y una línea no son lo mismo. Esa es una de las razones por las que los gráficos de barras 3D a menudo son engañosos.

Mayonesa
fuente