Proporción de tinta a datos y fondos de trazado

17

Me he dado cuenta de que muchos paquetes y temas de trama "de vanguardia" y mucha gente de datos distinguidos usan un fondo gris para sus tramas. Aquí hay varios ejemplos:

ggplot2:

ingrese la descripción de la imagen aquí

Fivethirtyeight.com de Nate Silver:

ingrese la descripción de la imagen aquí

Mientras que en el primer ejemplo anterior (ggplot2), se puede argumentar que el uso de fondo gris reduce la tinta necesaria para las líneas de cuadrícula, ciertamente este no es el caso con el segundo caso. ¿Cuáles son las ventajas de usar un fondo gris, a diferencia del blanco o transparente?

David D
fuente
2
Una trama es un plato servido, el fondo gris es un plato.
ttnphns
3
@ttnphns Me gusta la analogía. Hadley Wickham dijo sobre el fondo de ggplot: "El fondo gris le da a la trama un color similar (en un sentido tipográfico) al resto del texto, asegurando que los gráficos encajen con el flujo de un texto sin saltar con un fondo blanco brillante Finalmente, el fondo gris crea un campo de color continuo que asegura que la trama se perciba como una entidad visual única ". También justificó las líneas de cuadrícula sobre la base de que pueden "desconectarse" fácilmente.
Silverfish
1
ttnphns También me gusta mucho tu analogía. @silverfish sí, exactamente a la derecha, con la escala de grises haciendo coincidir tus ojos y compara el cuadrado de la trama con el texto de la página. Hadley ha hecho popular el fondo gris. Su diseño con el fondo gris de la trama pero el soporte blanco (ejes) deja en claro dónde comienzan y terminan los datos. Y los datos aparecen con más visibilidad que la cuadrícula de fondo, que sigue buenos principios cognitivos. La cuadrícula se sienta hasta que necesite usarla para buscar valores.
Dianne Cook
3
@Silverfish Mira primero a Jacques Bertin ( Semiologie Graphique ), Alan MacEachran ( Cómo funcionan los mapas ) y Lee Wilkinson ( La gramática de los gráficos ). MacEachran ofrece todos los detalles fisiológicos, psicológicos y culturales con muchas referencias. No se desanime por la referencia a "mapas": su libro trata principalmente de cómo las personas interactúan y crean significado a partir de gráficos informativos en general, de los cuales los mapas son solo un ejemplo destacado.
whuber
2
@silverfish Es posible que el trabajo de dan carr, que comenzó a usar el fondo gris y las líneas de cuadrícula blancas con las tablas para trazar el trabajo a principios de los 90 dev.bowdenweb.com/maps/m/using-gray-in-plots.pdf sea La fuente de la idea. Conozco a Hadley y discutí esto. Pero la analogía con la escala de grises entrecerrados de texto es la explicación de Hadley.
Dianne Cook

Respuestas:

18

La relación de tinta de datos

Este concepto se debe al muy influyente Edward Tufte , de la Universidad de Yale, quien lo describió en The Visual Display of Quantitative Information .

Distingue la "tinta de datos" (que incluye puntos, barras, etc., pero también etiquetas textuales o gráficas) de la tinta borrable (incluidas líneas de cuadrícula, ejes, bordes y también información redundante). La relación datos-tinta es simplemente esa proporción de la tinta utilizada que no se puede borrar.

Se discute cómo estos principios de tinta de datos podrían aplicarse a las visualizaciones de computadora en el sitio de intercambio de pila UX .

¿Por qué algunos expertos prefieren un fondo gris?

Hadley Wickham ha justificado su elección de fondo predeterminado, en su libro sobre ggplot2:

El fondo gris le da a la trama un color similar (en un sentido tipográfico) al resto del texto, asegurando que los gráficos encajen con el flujo de un texto sin saltar con un fondo blanco brillante. Finalmente, el fondo gris crea un campo de color continuo que asegura que la trama se perciba como una entidad visual única.

El principio parece ser evitar que "salte" al espectador en una página impresa y proporcionar unidad visual. Personalmente también me gusta el brillo de pantalla reducido.

También justificó las líneas de cuadrícula blancas sobre la base de que pueden "desconectarse" fácilmente. Estoy de acuerdo con Dianne Cook en los comentarios de que esto permite que los datos se destaquen por encima de las líneas de la cuadrícula, lo que reduce el desorden visual. Las líneas de cuadrícula blancas son una ventaja de un fondo ligeramente más oscuro; curiosamente, Tufte generalmente evita las líneas de cuadrícula donde no son necesarias (no cuentan como "tinta de datos") pero en algunos gráficos de barras grises se superponen las líneas de cuadrícula blancas. De alguna manera, este es un efecto similar ggplot2, pero en realidad pone las líneas de la cuadrícula en primer plano , dando a las barras una apariencia "rayada". Una desventaja particular de esto es que no puede ver la siguiente cuadrícula más alta sobre una barra,

¿Por qué algunos expertos prefieren un fondo blanco?

Uno de los ggplot2hilos más vistos en Stack Overflow es " ¿Cómo cambio el color de fondo? ", Lo que sugiere que el valor predeterminado no es universalmente popular.

El color de un elemento puede parecer bastante diferente según el color de fondo con el que se muestra. Tufte realmente discute esto en el Capítulo 5 "Color e información" en su libro Visualizando información, pero no lo pone en el contexto de, por ejemplo, un diagrama de dispersión. Maureen Stone, experta en color y profesora adjunta en la Universidad Simon Fraser, recomienda encarecidamente un fondo blanco por varias razones, incluida la mayoría de las paletas de colores (en sus ejemplos, utilizadas para indicar la especie o división) se han diseñado con un fondo blanco (para impresión) en mente. Sus propiedades perceptivas diferirán en un fondo más oscuro. Ella sugiere que el blanco tiene una ventaja perceptiva, porque nuestra percepción del color es relativa al blanco "local", por lo que tener un fondo blanco visualmente disponible puede estabilizar nuestra percepción.

También sugiere una razón más práctica con la que estoy familiarizado: que el uso de un fondo blanco le permite optimizar un gráfico tanto para la visualización electrónica como para la impresión, en lugar de tener que preparar una versión diferente para imprimir.

Lepisma
fuente
2
+1 para pintar (por así decirlo) ambos lados del problema. Escuché el razonamiento de Hadley pero no escuché el de Stone * Fraser. ¡Gracias!
Wayne
8

Siempre que el fondo sea lo suficientemente claro como para proporcionar un buen contraste con las marcas de datos, es principalmente una cuestión de estética, ya sea blanca o gris claro. Si bien el color de fondo es "tinta" en cierto sentido, no creo que cuente lógicamente como "tinta". No hay distracción proporcional de un campo sólido de color gris claro.

Por el contrario, las líneas de la cuadrícula cuentan como "tinta" lógica en ambos casos. Aunque las líneas de la cuadrícula blanca no consumirían tinta para imprimir, aún así rompen el fondo y crean un trabajo de procesamiento visual adicional. Yo diría que las líneas de la cuadrícula 538 toman menos tinta lógica porque tienen menos contraste.

xan
fuente
"Diría que las 538 líneas de cuadrícula toman menos tinta lógica ..." - Estoy de acuerdo, encuentro que las líneas de cuadrícula ggplot2 predeterminadas son extremadamente molestas. En el ejemplo de ggplot2 en la parte superior de la pregunta del OP, mis ojos se centran en las líneas de la cuadrícula en lugar de los datos.
Adrian