¿Cuáles son las reglas esenciales para diseñar y producir parcelas?

19

Antecedentes:

Anteriormente en Cross Validated, hemos tenido preguntas sobre:

@David sugirió en los comentarios a esta pregunta que deberíamos tener una pregunta wiki comunitaria con una regla de visualización por respuesta que la comunidad pudiera votar.

Pregunta

¿Cuáles son las reglas esenciales para diseñar y producir representaciones gráficas de datos?

Reglas

  • Una regla por respuesta
  • Idealmente, incluya una breve explicación de por qué cree que es una buena idea
  • Se prefieren las respuestas con ejemplos (código e imagen) de buenas y malas prácticas.
Jeromy Anglim
fuente

Respuestas:

13

Sustancia sobre forma : elija la gráfica, el estilo, el color u otros parámetros gráficos adecuados para mostrar lo que desea que muestre la gráfica, en lugar de lo que su paquete de gráficos necesariamente permite.

Fomite
fuente
8
(+1) A menudo prefiero esbozar un gráfico en papel primero para reducir la posibilidad de que mis decisiones de diseño se guíen por el camino de menor resistencia creado por el software de gráficos.
Jeromy Anglim
13

Estar familiarizado con las tres dimensiones del color puede ser útil. Si usa varios colores, idealmente deberían diferir en varias de esas dimensiones, no solo en una.

Valor. El gráfico debe seguir siendo legible incluso en blanco y negro. Esta simple regla debe tener en cuenta el daltonismo, las impresoras de baja calidad y las malas condiciones de iluminación. Incluso si usa tonos diferentes, asegúrese de que los valores sean lo suficientemente diferentes. En particular, los gráficos deben ser oscuros sobre un fondo claro (o lo contrario), pero no grises sobre un valor gris. El peor ejemplo sería una trama azul de fondo rojo; ambos son valores medios, es decir, darían grises muy similares después de la conversión en blanco y negro.

Saturación. La saturación debe usarse con moderación: una línea roja pura puede estar bien, pero una línea roja más gruesa y menos saturada será más legible (el mayor grosor ayuda a distinguir los colores y le permite reducir la saturación). Por otro lado, un área roja pura es dolorosa de ver: no use colores saturados para rellenar áreas. Las paletas de colores Brewer (diseñadas para mapas, no gráficos de líneas) ofrecen ejemplos de opciones de colores de baja saturación. El peor ejemplo sería, nuevamente, un fondo saturado (azul sobre rojo o rojo sobre azul).

Matiz. Como mencionó @gung, evite la combinación rojo / verde (semáforos): hay muchas más personas daltónicas de lo que cree. Especialmente con el tono, menos es más. Por ejemplo, para trazar valores "divergentes" (es decir, cantidades que pueden ser positivas o negativas), use solo dos tonos (para valores positivos y negativos), de modo que el lector pueda distinguir de inmediato qué es alto y qué es bajo. El uso de un gradiente discreto puede dar como resultado una gráfica mucho más legible: los límites entre los colores se hacen visibles y forman una gráfica de contorno.

Es posible que desee leer las Reglas prácticas de S. Few para usar el color en los gráficos o consultar cualquier material sobre "Teoría del color" para estudiantes de arte o diseño.

Vincent Zoonekynd
fuente
+1, buena información aquí. Su punto sobre el valor y cómo se renderizarán los colores después de la conversión a blanco y negro es particularmente bueno. El enlace al documento Pocos también es útil. Una nota: es mejor no referirse a otras respuestas como "arriba", use @ so-and-so en su lugar; las respuestas se mueven según la cantidad de votos que obtienen.
gung - Restablece a Monica
11

Coloque tanta información requerida dentro de la figura misma. No requiera que el lector haga referencia a la leyenda, por ejemplo, para identificar el significado de varios símbolos o colores. Coloque cualquier información (o información complementaria) que no pueda entrar en la figura en el título. La idea es minimizar el esfuerzo requerido por un visor de gráficos para extraer la información relevante : lo mejor: el gráfico se explica por sí mismo, el siguiente mejor: la información adicional requerida se puede obtener rápidamente del pie de foto, peor: el espectador debe leer detenidamente sección de resultados completos buscando algunos detalles cruciales para descubrir qué está sucediendo.

David
fuente
1
+1, y podemos ampliar esta idea aún más: Queremos que la gente pueda ver un gráfico y saber (tanto como sea posible) lo que está sucediendo sin tener que leer el pie de foto, y también cuando necesitan información adicional para tenga eso disponible en el subtítulo para que las personas puedan leer el subtítulo y saber lo que necesitan sin tener que leer el periódico buscando ese detalle crucial.
gung - Restablece a Monica
1
@gung ya que esto es CW, no dude en editar la respuesta para reflejar sus comentarios.
David LeBauer
10

Haz la trama lo más simple posible. En palabras de Tufte, "minimizar la relación datos-tinta".

Por ejemplo, evite:

  • más colores o formas de las requeridas
  • más marcas de las necesarias
  • Efectos tridimensionales en una trama bidimensional.
  • usando una leyenda cuando los objetos se pueden etiquetar directamente
David LeBauer
fuente
No estoy de acuerdo con Tufte aquí. Primero, una gran parte de la motivación de esta regla en su libro original es cuánto tiempo tiene que pasar dibujando líneas adicionales e innecesarias; Pero esto es irrelevante hoy. En segundo lugar, la idea real es mejor captada por la regla de Cleveland para maximizar la información del gráfico, ya que a veces la trama puede ser más informativa con más tinta, pero ambas reglas prohíben el chartjunk que ofende a Tufte.
gung - Restablece a Monica
@gung donde fue el esfuerzo / tiempo requerido presentado como una motivación por Tufte. No recuerdo esta parte (pero tampoco tengo el texto a mano).
David LeBauer
1
Tampoco lo tengo, pero en su primer libro Visual Display lo recuerdo hablando de cuántas veces tuviste que dejar la regla para dibujar un gráfico. Tal vez "grande" fue una exageración, pero recuerdo haber leído esto y pensar, '¿a quién le importa eso ahora?' En Elements , Cleveland hace un argumento convincente de que la regla de Tufte está equivocada. Argumenta que el objetivo es maximizar la transferencia de información y muestra que este principio también elimina lo que a Tufte no le gusta, pero permite casos (lo que muestra) en los que la tinta extra sin datos ayuda a que el gráfico sea más informativo.
gung - Restablece a Monica
Debo dejar en claro, no estoy en desacuerdo con algunas de las sugerencias específicas (por ejemplo, sin 3D, sin chartjunk); Estoy discutiendo con la regla de Tufte como guía para los gráficos.
gung - Restablece a Monica
@gung Interpreté la misma discusión como una herramienta heurística: una manera fácil para que el lector entienda el enfoque, en lugar de una forma de reducir el trabajo del diseñador.
David LeBauer
9

Deja tiempo para editar. Hacer un buen gráfico lleva tiempo y a menudo toma (al menos para mí) múltiples intentos.

Peter Flom - Restablece a Monica
fuente
6

No te opongas al rojo y al verde. El color puede ser útil, pero cuando use el color siempre tenga en cuenta que una minoría sustancial de personas son daltónicas de color rojo-verde. Una vez le estaba mostrando algunos datos a alguien, y él no podía ver lo que estaba sucediendo en mis gráficos: era un desperdicio y me sentí bastante estúpido. Otras formas de daltonismo son muy raras, pero el rojo-verde es bastante común. Esta página tiene mucha buena información. Aquí hay algunos consejos:

  • Si solo necesita dos colores, use azul y amarillo; no use rojo y verde.
  • Si necesita un gradiente, cambie de azul a amarillo mientras cambia la saturación y la luminosidad simultáneamente, no use el arco iris.
  • Si necesita codificar más de dos elementos (p. Ej., Puntos en un diagrama de dispersión de más de dos grupos, o varias líneas), respalde sus colores con diferentes símbolos de trazado / estilos de línea también. Por ejemplo, distintos símbolos de trazado: o + <sw, o líneas: sólido, punteado, punteado, punteado, etc. (también puede agregar símbolos de trazado a sus líneas o cambiar el grosor de las líneas).
gung
fuente
Esto es algo que me preguntaba con bastante frecuencia: ¿Cuál es el mejor gradiente de color para usar?
steffen
4

No use gráficos de barras apiladas. Y en una nota relacionada, si tiene un elemento de escala Likert, no sienta la necesidad de mostrar la proporción de cada respuesta a cada elemento. Esos gráficos hacen sangrar mis ojos.

No uses gráficos circulares.

No duplique los datos contenidos en un gráfico arrojándolos en una tabla.

Use una fuente sans serif como Arial para títulos de gráficos, etc., porque esos tipos de fuentes están diseñados para usarse de esa manera.

Ninguna publicación sobre diseño está completa sin una referencia de libro, realmente me gustan las reglas estadísticas generales . El capítulo 9 es el bit relevante para la discusión aquí, y los bits que señalo cuando me preguntan por qué odio los gráficos de barras y gráficos circulares apilados. :)

Confesión: en uno de mis primeros trabajos de consultoría estudiantil para un pequeño cliente de una ONG, les di un informe que tenía muchos gráficos de barras apilados, impresos en color (esto fue a mediados de la década de 1990). Creo que logré poner amarillo, morado y rojo en esos cachorros.

Michelle
fuente
3

No te metas con los ejes. No corte las primeras cien unidades solo porque la pendiente del gráfico se vea más impresionante. La imagen se pegará y la gente recordará un efecto mucho mayor de lo que realmente se midió.

xmjx
fuente
2
Cortar datos para cambiar la pendiente aparente es fraudulento. OTOH, hay una pregunta real acerca de si los ejes siempre deben incluir 0 y (algo menos relacionado) la relación de aspecto utilizada. Cleveland argumenta que los gráficos son más informativos si maximiza los datos dentro de la ventana de datos y las inclinaciones de 'banco' a 45 grados. Conozca a su audiencia, aquí: Cleveland argumenta que las audiencias profesionales deben tomarse como competentes y alfabetizadas, pero con audiencias ingenuas, ya sea explícitamente explique estas características y explíquelas, o (posiblemente) no las use.
gung - Restablece a Monica
Incluso el público profesional (supongo) meses después solo recordará la línea pronunciada en el gráfico y habrá olvidado la intercepción y todo lo demás. Puede tener todos esos datos en el gráfico (plano) al etiquetar los valores extremos correctamente y aún tener la información que nada cambió realmente en el tiempo.
xmjx
2
Estoy en desacuerdo. No creo que sea una regla sensata insistir en que todos los ejes comiencen en cero, si eso es lo que se sugiere. Los gráficos deben mostrar variación y estructura en los datos: si lo importante es la fluctuación de 100,000 alrededor del valor de dos millones (y tal vez cómo es diferente entre dos grupos), el gráfico debería mostrar que, no que "dos millones es un gran número ".
Peter Ellis el
Al igual que con cualquier regla de diseño, creo que esta es una que puedes romper si realmente entiendes el significado práctico de la variación trazada y cómo la interpretará tu audiencia. Pero esta regla se viola tan a menudo y tan atrozmente que creo que es relativamente seguro proclamar en voz alta "¡Todas las parcelas deben incluir cero! *". salvajemente en las últimas dos décadas, cuando en realidad la propagación máxima es de aproximadamente el 5%.
Matt Parker el
No es que el 5% sea irrelevante, y la mayoría de esas tramas están asociadas con argumentos sobre las consecuencias de las políticas que generaron esa fluctuación. Pero creo que esos argumentos serían aún más fuertes si enfatizaran cómo las políticas masivas con enormes consecuencias económicas en realidad tuvieron efectos relativamente pequeños en la propiedad de la vivienda.
Matt Parker el