¿Las líneas de cuadrícula y los fondos grises son chartjunk y deberían usarse solo de manera excepcional?

26

Parece que la mayoría de las autoridades están de acuerdo en que las líneas de cuadrícula oscuras o prominentes en las parcelas son "chartjunk" por cualquier definición razonable y distraen al espectador del mensaje en el cuerpo principal de la tabla. Así que no me molestaré en dar referencias sobre ese punto.

Igualmente, todos podemos estar de acuerdo en que habrá momentos en que las líneas de cuadrícula pálidas para crear una referencia para los espectadores serán necesarias. Tufte argumentó la necesidad de líneas de cuadrícula (y usadas) ocasionalmente, como se señala en este artículo . Y estoy de acuerdo con el enfoque de Hadley Wickham en ggplot2 para hacer que esas líneas de cuadrícula sean blancas sobre un fondo gris pálido, cuando necesite usarlas.

Sin embargo, no estoy seguro de si esas líneas de cuadrícula y fondo gris deberían ser los predeterminados , ya que están en ggplot2. Por ejemplo, parece que no hay ninguna razón para el fondo gris que no sea poner en relieve las líneas de la cuadrícula blanca, lo que plantea la pregunta de si es necesario. Recientemente comencé a usar ggplot2 para la mayoría de mis necesidades gráficas y creo que es increíble, pero ha desafiado mi enfoque de "gráficos sin recuadro, sin fondo ni líneas de cuadrícula" que utilicé antes. Solía ​​pensar que ese gridlines=OFFdebería ser mi valor predeterminado a menos que haya una razón particular para agregarlos, básicamente el enfoque recomendado en este artículo , por ejemplo.

Por supuesto, es sencillo definir un tema en ggplot2 para evitar las líneas de la cuadrícula y el sombreado de fondo (y de hecho lo hemos hecho en mi trabajo), pero el enfoque de ggplot2 es tan increíble y, en general, sus opciones estéticas predeterminadas son buenas y me pregunto si Me estoy perdiendo algo

Entonces, agradecería cualquier referencia sobre este punto. Estoy seguro de que se ha pensado bien (por ejemplo, por Hadley Wickham al establecer los valores predeterminados de ggplot2) y estoy muy abierto a que me apunten en la dirección correcta. Lo mejor que he podido encontrar es un par de enlaces en el grupo de ggplot2 google, pero la referencia más útil de Cleveland no está disponible en el enlace proporcionado.

Peter Ellis
fuente
77
Personalmente, me gustan las líneas de cuadrícula (tenues) por la razón obvia: para facilitar la estimación de los valores asociados con los puntos en el gráfico.
mark999
77
De p. 141 del libro de Hadley: "Todavía podemos ver las líneas de la cuadrícula para ayudar a juzgar la posición (Cleveland, 1993b), pero tienen poco impacto visual y podemos" ajustarlas "fácilmente. El fondo gris le da a la trama un color similar (en un sentido tipográfico) al resto del texto, asegurando que los gráficos encajen con el flujo de un texto sin saltar con un fondo blanco brillante. Finalmente, el fondo gris crea un campo continuo de color que asegura que la trama se percibe como una entidad visual única ".
mark999
44
Andrew Gelman ha hecho muchos blogs en infografías, en una línea similar. Personalmente, creo que los gráficos sin líneas de referencia son tan malos como las grillas en negrita que distraen. Más elegante y genial, pero aún interfiere con la comprensión y nuestra capacidad de profundizar en la información. La idea no es ser minimalista, como si fuéramos todos diseñadores de muebles de Scandanavian, sino comunicarnos claramente, lo que debería incluir líneas de referencia sutiles (pero útiles).
Wayne
3
Me doy cuenta de que hay una buena discusión aquí, pero todo en los comentarios, me pregunto en qué medida se puede proporcionar una respuesta única y autorizada, sospecho que esta pregunta sería mejor como CW, y luego podríamos avanzar (y elaborar ) algunos de estos buenos comentarios en respuestas.
gung - Restablecer Monica
1
Agregué una respuesta basada en algunos de los comentarios y la convertí en wiki de la comunidad
Peter Ellis el

Respuestas:

15

Una cosa que puede ayudar a avanzar el debate es reconocer lo que hace que las personas distingan visualmente entre el fondo y el primer plano, tomar lecciones de la cartografía y aplicarlo de manera más general a cualquier gráfico estadístico.

La gente puede pensar inicialmente que el color es una buena señal de si un objeto específico está en primer plano o en el fondo, pero este no es el caso. Tomemos, por ejemplo, este ejemplo a continuación, tomado de una publicación de blog de ESRI, Hacer que la gente quiera mirar: cinco principios de diseño principales para la cartografía de Aileen Buckley.

confusión en primer plano

Entonces, si te pidiera que dijeras cuál es la figura (por ejemplo, la masa de tierra) y cuál es el suelo (por ejemplo, el cuerpo de agua), ¿cuál elegirías? Un fenómeno similar también ocurre con la ilusión óptica del florero Rubin .

Algunas investigaciones experimentales que recuerdo haber leído en Cómo funcionan los mapas de Alan MacEachren sugieren que en las imágenes de arriba las personas eligen las áreas claras y oscuras con la misma frecuencia para la figura (aparentemente el tono y la saturación del color se usan para determinar la figura desde el suelo). Por lo tanto, el color no puede demarcar intrínsecamente si el fondo compite con el primer plano en cualquier gráfico estadístico, pero otras señales pueden ayudar.

Las personas a menudo asocian figuras como objetos cerrados (esto es parte de la razón por la cual el mapa anterior es confuso, ya que ninguna masa está encerrada). Esto sugiere en general (independientemente del color de fondo), los elementos en el gráfico deben tener límites claramente delineados y los elementos en el gráfico deben ser más oscuros que el fondo. Esto probablemente sesga el fondo de la trama de facto a blanco, pero tener un fondo gris no es condenatorio. Se pueden usar otros aspectos para delinear entre el primer plano y el fondo (la publicación del blog de ESRI menciona algunos de estos).

Una es la odiada sombra paralela de Excel para gráficos ( ejemplo dado aquí en este boletín por Dan Carr en la figura 2). Aunque eso debería venir con la advertencia de que las personas pueden interpretar los atributos numéricos en la ubicación de la sombra en lugar del elemento deseado.

Otro es usar diferentes colores / saturación para el contorno de un elemento en la trama versus el relleno interior. A continuación se dan ejemplos, con el círculo más a la izquierda un ejemplo de un límite no claramente delineado.

relleno vs esquema

Estos tampoco parecen ser exhaustivos. Para los gráficos de líneas, con frecuencia parece que las líneas más gruesas aparecen en primer plano, mientras que las líneas más delgadas retroceden al fondo.

Sin embargo, esto está destinado principalmente a ser un pensamiento: su autoestudio parece ser bastante exhaustivo (¡y le agradezco algunos de los recursos que proporcionó!) No creo estar en desacuerdo con ninguno de los recursos que proporcionó, pero no estoy seguro de entender lo que Hadley está hablando con su motivación para un fondo gris predeterminado. Pero la preferencia estética personal por los fondos grises puede acomodarse asegurándose de que los elementos en la trama se pongan en primer plano (eso es lo que realmente importa). Estas lecciones también se pueden aplicar a las líneas de cuadrícula, y si las líneas de cuadrícula ayudan y son discretas (es decir, en segundo plano), ciertamente no son chartjunk.

Andy W
fuente
55
No creo que la pregunta principal sea distinguir entre el fondo y el primer plano, creo que es bastante sencillo. El verdadero desafío es crear el gráfico de manera que sea lo más fácil y preciso posible hacer las comparaciones que le interesan. En mi experiencia, las líneas de cuadrícula hacen que sea más fácil leer y comparar valores, aunque no lo hago tener alguna experimentación formal para respaldar esto.
Hadley
@hadley, supuse que las quejas (principales) sobre los fondos grises (y las líneas de cuadrícula) eran que eran molestas, lo que sugiere que compiten por la atención con los elementos de datos reales en la trama. Esto para mí sugiere confusión en primer plano / fondo. Sin embargo, mis suposiciones también podrían estar equivocadas (tal vez sean razones puramente estéticas que la gente prefiere o no les gustan). Distinguir entre primer plano y fondo puede ser sencillo, pero no creo que sea de conocimiento común, así que espero que mi publicación sea útil en ese sentido.
Andy W
11

El profesor Wickham escribió en el libro ggplot2:

"Todavía podemos ver las líneas de la cuadrícula para ayudar a juzgar la posición (Cleveland, 1993b), pero tienen poco impacto visual y podemos" ajustarlas "fácilmente. El fondo gris le da a la trama un color similar (en un sentido tipográfico) ) al resto del texto, asegurando que los gráficos encajen con el flujo de un texto sin saltar con un fondo blanco brillante. Finalmente, el fondo gris crea un campo de color continuo que asegura que la trama se perciba como un solo entidad visual ".

Y @Wayne escribió:

"Personalmente, creo que los gráficos sin líneas de referencia son tan malos como las grillas en negrita y distractoras. Más elegantes y geniales, pero aún interfieren con la comprensión y nuestra capacidad de profundizar en la información. La idea no es ser minimalista, como si nosotros eran todos diseñadores de muebles escandinavos, pero para comunicar claramente, lo que debería incluir líneas de referencia sutiles (pero útiles) "

y @Peter Flom escribió:

Creo que las líneas de cuadrícula débiles deberían ser las predeterminadas en un diagrama de dispersión; ellos ayudan al lector; Del mismo modo, los espacios en blanco entre las palabras y la línea del texto ayudan al lector. Sin embargo, no me gusta el fondo gris. Me resulta molesto. El texto, después de todo, suele ser letras negras sobre fondo blanco.

Peter Ellis
fuente
3

Si bien tiendo a evitar el fondo gris predeterminado, quizás una de las razones por las que Hadley se haya ido con el gris es permitir que el usuario use más colores claros y saturados para mostrar los datos, que pueden no parecer tan efectivos con un fondo blanco.

Estrella nueva
fuente
¿Fue esto una respuesta a la pregunta del OP, un comentario solicitando una aclaración del OP o uno de los que respondieron, o una nueva pregunta propia? Utilice solo el campo "Su respuesta" para proporcionar respuestas a la pregunta original. Podrás comentar en cualquier lugar cuando tu reputación sea> 50. Si tiene una nueva pregunta, haga clic en el gris ASK QUESTION en la parte superior de la página y pregunte allí, entonces podemos ayudarlo adecuadamente.
gung - Restablece a Monica
2
De hecho, creo que esto constituye una respuesta a la pregunta, al menos parcialmente: hay una discusión aquí sobre si el fondo gris constituye basura de la tabla, y algún razonamiento para sugerir por qué no.
Silverfish
0

Personalmente, prefiero el tema dark-on-light theme_bw, o incluso theme_minimal, al tema predeterminado de ggplot2; consulte http://docs.ggplot2.org/current/ggtheme.html .

tema predeterminado

Encuentro que el fondo gris en el tema predeterminado es extremadamente molesto: mi ojo se ve atraído por los bloques grises en lugar de los puntos. ¿Eso sucede a alguien más? Por ejemplo, en el diagrama de juguete anterior, mi ojo a menudo se ve atraído hacia la parte inferior derecha (donde no hay puntos de datos).

(¿No sería interesante ver grabaciones de seguimiento visual de personas que miran estas parcelas?)

Personalmente prefiero esto:

dark-on-light theme_bw

... pero es muy subjetivo: no creo que deba haber una sola regla que todos tengan que seguir.

Código para estas parcelas:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
Adrian
fuente