Esta es una pregunta de visualización de datos. Espero que esté bien preguntar esto aquí.
¿Cuándo es apropiado usar un relleno debajo de un gráfico lineal para una serie de tiempo, como el gráfico a continuación? (que muestra tiempos de ping durante un día)
Supongo que es más común usar una línea simple, sin relleno debajo, pero ¿está bien usar un relleno para la variedad visual?
Me interesaría especialmente saber acerca de cualquier investigación perceptiva sobre el tema, o cualquier guía de estilo.
data-visualization
Ricardo
fuente
fuente
0s
es el límite inferior natural y lo muestras, ¿por qué no?Respuestas:
Hay un poco de arte en equilibrar los aspectos estéticos e informativos de un gráfico. Destacados consultores / autores de visualización como Edward Tufte y Stephen Few eligen una estética mínima que evita la distracción de las partes informativas del gráfico. Sin embargo, para algunas audiencias se justifica una pequeña cantidad de florecimiento; ver la aplicación periodística de visualización de datos de Alberto Cairo, por ejemplo.
El ángulo de investigación perceptual es que cada elemento gráfico comunica un mensaje, algunos de los cuales no somos conscientes porque nuestra corteza visual se ocupa de él (" procesamiento previo a la atención "). Los elementos adicionales, incluso los redundantes, pueden generar un procesamiento adicional. El gráfico apropiado depende del mensaje que se comunicará y de la audiencia.
Para su pregunta específica, una línea conectada enfatiza una tendencia (y la variación de una tendencia). El área rellena enfatiza la desviación de la línea base. Un gráfico de barras o gráfico de agujas enfatizaría eventos discretos que se desvían de una línea de base.
El contexto del gráfico también es importante. Si tiene una cuadrícula de gráficos apretados, el relleno ayudará a asociar cada línea con su línea base.
Finalmente, otra consideración para agregar elementos gráficos / florituras redundantes es que hace que sea más difícil extender el gráfico con elementos más informativos. Por ejemplo, es posible que desee resaltar valores especiales, superponer otras líneas de tendencia o bandas de superposición, como en la siguiente maqueta.
fuente
Un par de puntos más a considerar:
Como se menciona en un comentario, un relleno insuficiente es en gran medida inapropiado si el eje x no está en un punto natural cero. Esto puede deberse a que el eje y está escalado para comenzar en un número distinto de cero, o porque las unidades utilizadas no tienen una interpretación de cero natural (por ejemplo, Kelvin tiene un cero natural, mientras que Celsius no).
En segundo lugar, un caso en el que un relleno insuficiente es particularmente válido es si los datos en sí mismos podrían considerarse insuficientes. Por ejemplo, un gráfico de líneas de la altura de una montaña tiene sentido que se llene por debajo, el color de relleno representa la tierra, mientras que sin relleno representa el aire.
Un ejemplo relacionado podría ser el recuento de datos. Si apilamos a todos los individuos en cada punto x, obtendríamos un gráfico de barras. Si la interpolación entre las barras tiene sentido, terminaríamos con un gráfico de líneas con un relleno inferior.
Esta imagen de la 'pantalla visual de información cuantitativa' podría explicarlo un poco mejor. Muestra qué unidades militares estaban en Europa durante la segunda guerra (creo). Apilar las unidades en cada punto de tiempo le proporciona un gráfico de barras con relleno insuficiente. Dibujar una línea sobre la parte superior de los datos le proporciona un gráfico de líneas con relleno insuficiente.
fuente
Las dos respuestas anteriores cubren los principales puntos importantes, pero hay algunas cosas que aún deben mencionarse.
Primero, debo decir que no estoy de acuerdo con el enfoque minimalista extremo de los gráficos: que toda la tinta redundante debe desaparecer. Distracción, variación no significativa debe ir. Pero un área sólida frente a una sola línea puede llamar la atención y comunicarse más de un vistazo. Y como usted dice, puede agregar "variedad visual".
Sin embargo, como señala @xan, esa mirada rápida también interpreta un área de manera diferente a una línea, en formas parcialmente inconscientes.
Un gráfico de área implica una cantidad total acumulada a medida que avanza a lo largo del eje x. Si compara dos gráficos y uno tiene un área más grande rellenada, su mirada le indicará que tiene un total mayor independientemente de los valores iniciales y finales.
En contraste, un gráfico lineal muestra un valor cambiante. El foco está en el cambio de posición de un punto al siguiente, no en el total acumulado.
Entonces, ¿cuándo deberías usar un gráfico de área?
La idea es que, al leer el gráfico, si toma dos puntos en el eje x, el área que se muestra entre ellos debe representar una cantidad real de algo que se acumula en ese rango. Por esta razón, si sus valores incluyen cantidades negativas, recomendaría usar colores opuestos para las áreas negativas y positivas para enfatizar que se cancelan en el total.
¿Cuándo no deberías usar un gráfico de área?
Con esas pautas en mente, su gráfico de ping se puede interpretar de dos maneras.
Por un lado, si piensa en la velocidad de ping como una variable única que cambia a lo largo del día, entonces un gráfico lineal simple sería lo más apropiado.
Por otro lado, si estaba comparando los patrones diarios de velocidad de ping de dos redes diferentes (o la misma red en diferentes días / períodos de tiempo), entonces quizás desee enfatizar la cantidad total de tiempo requerido para las tareas de red. Por ejemplo, si su gráfico tenía múltiples picos, en lugar de uno solo, un gráfico lineal enfatizaría la variabilidad en la velocidad, mientras que un gráfico de área enfatizaría el retraso total.
Compare:
El total acumulado es ligeramente mayor en la primera mitad del gráfico (a la izquierda de la línea roja) que en la segunda, incluso si los picos alcanzan valores máximos más altos a la derecha. El relleno enfatiza ese bloque sólido a la izquierda, para que se equilibre mejor contra los picos.
(¡Perdone la mala calidad de imagen, no pude encontrar la manera de hacer que R haga un gráfico de área! Tuve que exportar y editar por separado).
fuente