¿Qué atributos hacen que una figura sea de "calidad profesional"?

35

He escuchado a la gente decir que las parcelas producidas por ORIGIN tienden a parecer pulidas y "profesionales", mientras que las tramas producidas por Mathematica no lo hacen. Sin embargo, la mayoría de los programas de creación de parcelas son bastante configurables y es lógico pensar que con la configuración correcta para cosas como ubicación y etiquetado, selección de fuente y color, alineación de etiquetas, etc., debería ser capaz de hacer una figura con Mathematica / matplotlib / Gnuplot / etc. que se ve tan bien como los que vienen de ORIGIN. Pero, ¿qué significa que una figura sea "profesional" en este contexto?

En otras palabras, si mi objetivo es crear las mejores figuras posibles para su inclusión en un artículo científico, ¿qué opciones de diseño se recomiendan generalmente para ese objetivo? Obviamente, uno tiene que elegir el tipo de diagrama apropiado , por ejemplo, gráfico de barras vs. diagrama de dispersión y escala lineal vs. Estoy más interesado en las cosas en las que normalmente no pensamos, que normalmente se configuran de acuerdo con los valores predeterminados de algunos programas de trazado, pero que podrían modificarse para mejorar el aspecto de la trama.

David Z
fuente
2
Esto puede estar fuera de tema aquí ... Lo estoy publicando para sondear los límites de qué preguntas de visualización de datos son aceptables (cf meta.scicomp.stackexchange.com/questions/55/… )
David Z
55
Teniendo en cuenta la mala calidad de muchas parcelas que se convierten en publicaciones científicas, ¡puede ser que la definición de la comunidad necesite mejoras!
David Ketcheson
2
@DavidZaslavsky: creo que este podría ser el lugar más apropiado para esta pregunta, ya que es específico para la presentación de datos científicos, que es parte de la ciencia computacional. A menudo he visto quejas de los científicos de que los gráficos producidos por nuestro software no cumplen con el estándar de publicación y deben ser retocados, por lo que sería bueno ver las experiencias de otras personas con este problema. Como siempre, aunque con preguntas subjetivas, las respuestas deben seguir las seis pautas .
Mark Booth
Por supuesto, @Mark. He tratado de hacer esto lo más objetivo posible dado que no es una cuestión técnica.
David Z
Gracias David, mi comentario estaba más dirigido a las preguntas que respondían, ya que estábamos tendiendo hacia respuestas cortas en ese momento. Las seis pautas prefieren mucho más que corto, experiencia sobre opinión, contexto sobre suposición, imparcialidad sobre prejuicios, serio sobre impertinente y sugieren respaldar respuestas con hechos y referencias, etc. Todo esto parece ser algo bueno para luchar en las respuestas a este tipo de pregunta.
Mark Booth

Respuestas:

14

En mi opinión, lo que hace que una figura sea de "calidad profesional" está definida por las reglas de la revista / editorial. Lo que en realidad se traduce en "calidad de publicación", que es relativa dependiendo de dónde publique. Algunas reglas universales parecen sobresalir, invariables del software de trazado utilizado:

1) Una figura debe contener la menor cantidad posible de elementos necesarios para transmitir la información / idea / argumento. Una figura debe leerse / entenderse fácilmente en pocos segundos; si le toma más tiempo comprender lo que está sucediendo en la figura, podría ser demasiada información. Esto a veces es difícil de verificar ya que está familiarizado con su propia trama / datos, sin importar cuán sobrecargada esté, mostrándola a pocos colegas para ver si pueden leerla fácilmente. (no debe confundirse con la comprensión del significado físico detrás de la figura; esto generalmente lleva bastante tiempo).

2) Si tiene que usar colores, es mejor limitarse a unos pocos, idealmente en el lado opuesto de la rueda de colores. Por ejemplo, azul y rojo es mejor que azul y verde. Una figura puede tener muchos tonos, pero es mejor tener pocos colores principales. A menudo me gusta usar azul (valores bajos) y rojo (valores altos) con una transición blanca en el medio. Siempre tenga en mente lectores daltónicos.

3) Las marcas de graduación, las etiquetas de contorno, etc., deberían ser fácilmente legibles sin una lupa; por lo tanto, un tamaño de fuente similar al del texto del cuerpo de la revista. Puede verificar si todo es legible imprimiendo una copia impresa con anchos de figura de 3 y 6 pulgadas (estos son tamaños de figura comunes en revistas científicas).

4) Finalmente, asegúrese de que cada elemento de la figura tenga su propósito. Si hay algo que no transmite información útil, deséchelo. Ayudará a la legibilidad de la figura.

En el punto en que se sienta cómodo con la personalización de todos los pequeños elementos que forman una figura (marcas de graduación, etiquetas, etc.), realmente no importa qué herramienta use siempre que pueda producir un EPS limpio.

milancurcic
fuente
¿Puedes dar más detalles sobre la justificación de (1)? Unos pocos segundos no es mucho tiempo. ¿Es esto sobre la base pragmática de que la gente está muy, muy ocupada, de modo que si lleva más de unos segundos entender la figura, no se molestarán?
Faheem Mitha
@FaheemMitha No, lo que realmente quise decir es que le estás haciendo un favor a los lectores si mantienes la figura clara y simple. No espere unos segundos como un criterio sólido: así es como estoy acostumbrado a evaluar mis propias cifras. Existe un límite para la cantidad de información que puede poner en una figura: al poner demasiada información, puede terminar haciendo que el contenido sea difícil de entender para el lector. Sus lectores se molestarán en leer incluso cifras muy ocupadas si están interesados ​​en su trabajo, pero una cifra menos ocupada hace un mejor trabajo al transmitir la información.
milancurcic
No estoy seguro de que tenga sentido aceptar una respuesta a una pregunta tan nebulosa, pero esta respuesta parece codificar mejor las ideas vagas que tenía en mente cuando la pregunté. Entonces obtienes la marca de verificación :-)
David Z
18

Hay un par de elementos que busco cuando considero algo de "calidad de publicación" en mi propio trabajo o en lo que estoy considerando al mirar a otros. Son:

  1. Alta resolución, y preferiblemente basada en vectores. Esto ya debería ser bastante obvio, pero te sorprenderías.
  2. La falta de desorden. Debería poder ver lo que sucede en tu figura y verlo rápidamente. Hay pocas cosas que odio más que alguien que intenta tomar la guía "Tinta alta: relación de papel" y usarla para tratar de agrupar un manuscrito completo en una sola figura.
  3. Imprime bien Este es el que realmente es más importante para mí, y cuando reviso documentos, uno que siempre pruebo. "¿Se imprimen las figuras?" Más de una vez, he golpeado figuras cuyos puntos están completamente ofuscados cuando se imprimen en escala de grises, lo que los hace inútiles para mis propósitos (no leo en las pantallas).
  4. Evidencia de que el creador sabe cómo usar la configuración de gráficos. No hay opciones de eje de bola impar, marcas en el lugar correcto, etc.
  5. Combinado con el n. ° 2, una falta de "florecimiento" que es completamente de naturaleza gráfica. Sombras, 3D innecesarios, etc. que realmente no hacen más que perder el tiempo de los lectores.

La mayoría de ellos son honestamente específicos del creador, más que específicos del programa. He visto gráficos terribles en R y gráficos excelentes en Excel.

Fomite
fuente
Los gráficos vectoriales son realmente deseables. Pero, ¿hay algún programa de dibujo ampliamente utilizado que no lo sea?
Faheem Mitha
2
Programas de dibujo? No es que se me ocurra. Programas que producen parcelas: ¿paquetes estadísticos y similares? Muchos de ellos tienen formatos de salida no vectoriales disponibles o como valores predeterminados.
Fomite
14

Si hablamos de cifras de datos, iría a las fuentes: The Visual Display of Qualitative Information and Beautiful Evidence de Edward Tufte .

El Sr. Tufte, por supuesto, entra en algunos detalles, pero el principio que se destaca para mí no es gastar tinta en marcos y decoración, sino hacer que la mayor cantidad posible de tinta lleve información.

Modificado por solicitud de Mark:

Algunos puntos importantes de The Visual Display of Qualitative Information son

  • mostrar los datos de manera que no distorsionen ni ofusquen lo que tienen que decir
  • organizar pantallas para permitir comparaciones entre diferentes datos en diferentes niveles
  • integrar los aspectos gráficos con las descripciones estadísticas y verbales
  • maximice la relación de datos a tinta eliminando elementos que no sirven para ningún propósito (o que son redundantes por otros elementos) y use los elementos que hay para transmitir información adicional (ejes que son variantes en un diagrama de caja, por ejemplo)
  • se pueden usar pequeños múltiplos para organizar conjuntos de datos de dimensiones superiores para permitir la comparación a lo largo de estas dimensiones adicionales

Beautiful Evidence es un libro de mayor alcance en su alcance. Solo reproduciré los títulos de los capítulos:

  • Imágenes mapeadas: imágenes como evidencia y explicación
  • Sparklines: gráficos intensos, simples y de tamaño Word
  • Enlaces y flechas causales: ambigüedad en acción
  • Palabras, Números, Imágenes - Juntos
  • Los principios fundamentales del diseño analítico
  • Corrupción en las presentaciones de evidencia: efectos sin causas, selección de cerezas, extralimitación, Chartjunk y la rabia para concluir
  • El estilo cognitivo de PowerPoint: sacando corruptos dentro
  • Pedestales escultóricos: significado, práctica, dependencia
  • Esculturas de paisaje

Una de las observaciones interesantes en Beautiful Evidence es que generalmente usamos dispositivos de salida de alta densidad (una impresora de 300 DPI es un dispositivo de baja densidad actualmente) para material impreso, pero a menudo dibujamos nuestras cifras para la impresora de pantalla o línea, lo que desperdicia un enorme potencial para transmitir información.

dmckee
fuente
La página 13 de La presentación visual de información cuantitativa comienza con un bonito punto de viñeta, un resumen de "gráficos profesionales", o como se titula allí "Excelencia gráfica".
Brian Diggs
@Brian Diggs: ¿podrían usted o dmckee actualizar esta respuesta con un resumen de los puntos principales? Muchos de nosotros podemos estar lo suficientemente interesados ​​como para conocer el resumen sin estar lo suficientemente interesados ​​como para realmente salir y comprar los libros.
Mark Booth
@ Mark: Lo conseguiré al día siguiente más o menos ... mi copia está en la oficina y ahora no.
dmckee
8

Las mejores cifras que he podido hacer personalmente han sido con el paquete TeX PGF / TikZ . Si usa LaTex, como muchos en las ciencias duras, probablemente ya haya oído hablar de él.

También parece ser el líder en paquetes de gráficos LaTex. Una proporción considerable de las preguntas en el sitio TeX StackExchange son sobre PGF / TikZ. No estoy seguro de por qué los resultados son tan buenos, pero ciertamente una ventaja que PGF / TikZ tiene sobre otros paquetes cuando se usa LaTeX es que simplemente se integra mejor con el texto. Por un lado, las fuentes en la figura serán las mismas que en el texto.

Faheem Mitha
fuente
Por supuesto, en realidad es mi forma favorita de hacer figuras también ;-) Pero estoy más interesado en por qué las tramas de TikZ se consideran buenas.
David Z
1
@DavidZaslavsky: No lo sé. ¿Hasta que es un genio? :-)
Faheem Mitha
@DavidZaslavsky: En serio, esa pregunta es una explosión en el tema de tex.sx, y probablemente ya se haya abordado allí.
Faheem Mitha
1
@EpiGrad: Solo quise decir que preguntar específicamente sobre TikZ sería más útil en tex.sx, si David tuviera esa mentalidad. Por supuesto, la pregunta más amplia no estaría en el tema de tex.sx.
Faheem Mitha
1
pgfplots es bastante asombroso. De forma predeterminada, se ve más o menos como lo desea, es decir, etiquetas en caja, nítidas para vectores, consistentes con el texto del cuerpo, et. Pero también es fácil de ajustar. Mi truco favorito es quitar los ejes de una trama de pseudo color de Matlab, recortarlos y luego envolverlos en TikZ. De esta forma, obtienes una imagen ráster para el pseudo color (este es uno de los pocos casos en los que es preferible un gráfico ráster) y la bondad de LaTeX para ejes y etiquetas, e incluso la barra de color. Esta es una de mis respuestas usando pgfplots
qubyte
6

Es casi más fácil caracterizar lo que constituye un mal gráfico que lo que hace que un gráfico sea bueno.

Algunas características de los malos gráficos:

  • Fuentes y símbolos excesivamente grandes o pequeños
  • Líneas excesivamente delgadas o gruesas para curvas y otras características gráficas
  • Se muestran o varían demasiadas variables diferentes al mismo tiempo
  • Tener selecciones de eje inapropiadas (log versus lineal, rango, etc.)
  • Mostrar tendencias entre puntos de datos con curvas sólidas que indican progresiones o comportamientos que podrían no existir
  • No dar indicación de la magnitud de incertidumbres o errores.
  • Gráficos mal etiquetados o etiquetados (¡incluidas las unidades!)

Sin embargo, en general, aunque la mayoría de los paquetes de software son capaces de crear buenos gráficos, casi ningún programa con el que he trabajado tiene un estado predeterminado que produce buenos gráficos. Siempre requieren ajustes: tamaños de fuente, rangos de visualización, ejes o opciones de símbolos, etc. Actualmente, prefiero usar matplotlib; otros en mi grupo han migrado a SciDavis.

aeismail
fuente
No estoy seguro de lo que quiere decir con "No dar indicación de errores". puedes aclarar? De lo contrario, buena lista.
Faheem Mitha
Editado para mayor claridad: "No dar indicación de la magnitud de las incertidumbres o errores". Sin embargo, cuando los errores son demasiado pequeños para mostrarse, esto se puede indicar en el título.
aeismail
5

He tenido un éxito razonable usando el paquete LevelScheme de Mathematica . Su modelo de ejecución difiere ligeramente de la programación tradicional de Mathematica, por lo que hay una curva de aprendizaje asociada con su uso. Sin embargo, es capaz de proporcionar un control preciso de la generación de gráficos, lo que es difícil en Mathematica. Además, como paquete lateral, hay un paquete para generar marcas de verificación personalizadas.

(Una vez que salga la versión con soporte de Mathematica v.8, se cambiará el nombre a SciDraw).

rcollyer
fuente