Formateo de gráficos: ¿cuándo es apropiado usar un relleno debajo de un gráfico lineal?

13

Esta es una pregunta de visualización de datos. Espero que esté bien preguntar esto aquí.

¿Cuándo es apropiado usar un relleno debajo de un gráfico lineal para una serie de tiempo, como el gráfico a continuación? (que muestra tiempos de ping durante un día)

Gráfico de líneas con relleno debajo

Supongo que es más común usar una línea simple, sin relleno debajo, pero ¿está bien usar un relleno para la variedad visual?

Me interesaría especialmente saber acerca de cualquier investigación perceptiva sobre el tema, o cualquier guía de estilo.

Ricardo
fuente
1
Si 0ses el límite inferior natural y lo muestras, ¿por qué no?
ttnphns
1
Pregunte de otra manera: ¿por qué usar relleno si no es necesario? Imagine que desea agregar otra línea de tendencia y las cosas se complican innecesariamente. También separaría las unidades y la escala del eje y.
Martin

Respuestas:

11

Hay un poco de arte en equilibrar los aspectos estéticos e informativos de un gráfico. Destacados consultores / autores de visualización como Edward Tufte y Stephen Few eligen una estética mínima que evita la distracción de las partes informativas del gráfico. Sin embargo, para algunas audiencias se justifica una pequeña cantidad de florecimiento; ver la aplicación periodística de visualización de datos de Alberto Cairo, por ejemplo.

El ángulo de investigación perceptual es que cada elemento gráfico comunica un mensaje, algunos de los cuales no somos conscientes porque nuestra corteza visual se ocupa de él (" procesamiento previo a la atención "). Los elementos adicionales, incluso los redundantes, pueden generar un procesamiento adicional. El gráfico apropiado depende del mensaje que se comunicará y de la audiencia.

Para su pregunta específica, una línea conectada enfatiza una tendencia (y la variación de una tendencia). El área rellena enfatiza la desviación de la línea base. Un gráfico de barras o gráfico de agujas enfatizaría eventos discretos que se desvían de una línea de base.

El contexto del gráfico también es importante. Si tiene una cuadrícula de gráficos apretados, el relleno ayudará a asociar cada línea con su línea base.

Finalmente, otra consideración para agregar elementos gráficos / florituras redundantes es que hace que sea más difícil extender el gráfico con elementos más informativos. Por ejemplo, es posible que desee resaltar valores especiales, superponer otras líneas de tendencia o bandas de superposición, como en la siguiente maqueta.

ingrese la descripción de la imagen aquí

xan
fuente
1
Estoy de acuerdo con ésto. A menos que el gráfico necesite ser colorido porque es la portada de una revista / libro (y la gente de marketing quiere que esté coloreado), se debe usar el color para informar. Si el gráfico parece "aburrido", entonces el culpable es el hecho de que la información subyacente no es muy interesante o no es muy interesante en formato de gráfico lineal. En tales casos, tal vez sería más útil en un gráfico circular, diagrama de radar u otra cosa.
rocinante
1
Sugiero no usar un gráfico circular. Es más difícil percibir diferencias en la longitud del arco y el área de la cuña que las diferencias en altura. Si no me cree, compare un gráfico circular en proporciones 32:34:33 con el mismo gráfico de barras. ¿Cuál es más fácil de leer?
shadowtalker
2
Estaba hablando en términos generales, no específicamente para el gráfico anterior. Cada tipo de gráfico tiene sus méritos. Un cierto tipo de gráfico no es apropiado en todas las situaciones.
rocinante
4

Un par de puntos más a considerar:

Como se menciona en un comentario, un relleno insuficiente es en gran medida inapropiado si el eje x no está en un punto natural cero. Esto puede deberse a que el eje y está escalado para comenzar en un número distinto de cero, o porque las unidades utilizadas no tienen una interpretación de cero natural (por ejemplo, Kelvin tiene un cero natural, mientras que Celsius no).

En segundo lugar, un caso en el que un relleno insuficiente es particularmente válido es si los datos en sí mismos podrían considerarse insuficientes. Por ejemplo, un gráfico de líneas de la altura de una montaña tiene sentido que se llene por debajo, el color de relleno representa la tierra, mientras que sin relleno representa el aire.

Un ejemplo relacionado podría ser el recuento de datos. Si apilamos a todos los individuos en cada punto x, obtendríamos un gráfico de barras. Si la interpolación entre las barras tiene sentido, terminaríamos con un gráfico de líneas con un relleno inferior.

Esta imagen de la 'pantalla visual de información cuantitativa' podría explicarlo un poco mejor. Muestra qué unidades militares estaban en Europa durante la segunda guerra (creo). Apilar las unidades en cada punto de tiempo le proporciona un gráfico de barras con relleno insuficiente. Dibujar una línea sobre la parte superior de los datos le proporciona un gráfico de líneas con relleno insuficiente.

timcdlucas
fuente
2
... Las unidades militares estadounidenses estuvieron en Europa durante la Primera Guerra Mundial (las fechas de 1917 y 1918 cuentan la historia).
Nick Cox
@nickCox Por supuesto. No tengo idea de por qué no vi eso.
timcdlucas
4

Las dos respuestas anteriores cubren los principales puntos importantes, pero hay algunas cosas que aún deben mencionarse.

Primero, debo decir que no estoy de acuerdo con el enfoque minimalista extremo de los gráficos: que toda la tinta redundante debe desaparecer. Distracción, variación no significativa debe ir. Pero un área sólida frente a una sola línea puede llamar la atención y comunicarse más de un vistazo. Y como usted dice, puede agregar "variedad visual".

Sin embargo, como señala @xan, esa mirada rápida también interpreta un área de manera diferente a una línea, en formas parcialmente inconscientes.

Un gráfico de área implica una cantidad total acumulada a medida que avanza a lo largo del eje x. Si compara dos gráficos y uno tiene un área más grande rellenada, su mirada le indicará que tiene un total mayor independientemente de los valores iniciales y finales.

En contraste, un gráfico lineal muestra un valor cambiante. El foco está en el cambio de posición de un punto al siguiente, no en el total acumulado.

Entonces, ¿cuándo deberías usar un gráfico de área?

  • cuando los valores representan una cantidad clara con un punto cero definido que se muestra en el gráfico;
  • cuando el valor representa una cantidad agregada (o eliminada) en cada punto, como la lluvia diaria normal o la ganancia / pérdida mensual;
  • cuando el valor representa una distribución de una población, lo que significa que el área total debajo de la curva representa el tamaño total de la muestra, como la curva de campana del número de estudiantes con diferentes grados (básicamente un histograma suavizado).

La idea es que, al leer el gráfico, si toma dos puntos en el eje x, el área que se muestra entre ellos debe representar una cantidad real de algo que se acumula en ese rango. Por esta razón, si sus valores incluyen cantidades negativas, recomendaría usar colores opuestos para las áreas negativas y positivas para enfatizar que se cancelan en el total.

¿Cuándo no deberías usar un gráfico de área?

  • cuando el punto cero es arbitrario (como en temperatura no absoluta, como dijo @timcdlucas), inválido (como en mediciones que son una relación de dos valores, como una tasa de cambio), o no se muestra en el gráfico por razones de espacio;
  • cuando los valores mostrados por la altura de la línea ya representan una medida acumulativa, como la precipitación total hasta la fecha (para el mes / año) o la deuda / ahorro;
  • cuando los valores representan la posición / valor de una sola entidad cambiante en lugar de una acumulación;
  • cuando desee comparar varias líneas en el mismo gráfico (si no puede ver el área completa, pierde el significado; en su lugar, compare los gráficos de área uno al lado del otro).

Con esas pautas en mente, su gráfico de ping se puede interpretar de dos maneras.

Por un lado, si piensa en la velocidad de ping como una variable única que cambia a lo largo del día, entonces un gráfico lineal simple sería lo más apropiado.

Por otro lado, si estaba comparando los patrones diarios de velocidad de ping de dos redes diferentes (o la misma red en diferentes días / períodos de tiempo), entonces quizás desee enfatizar la cantidad total de tiempo requerido para las tareas de red. Por ejemplo, si su gráfico tenía múltiples picos, en lugar de uno solo, un gráfico lineal enfatizaría la variabilidad en la velocidad, mientras que un gráfico de área enfatizaría el retraso total.

Compare:
Gráfico de líneas Mismo gráfico con área llena
El total acumulado es ligeramente mayor en la primera mitad del gráfico (a la izquierda de la línea roja) que en la segunda, incluso si los picos alcanzan valores máximos más altos a la derecha. El relleno enfatiza ese bloque sólido a la izquierda, para que se equilibre mejor contra los picos.

(¡Perdone la mala calidad de imagen, no pude encontrar la manera de hacer que R haga un gráfico de área! Tuve que exportar y editar por separado).

AmeliaBR
fuente