A menudo trato con una cantidad razonable de datos de series de tiempo, 50-200 millones de dobles con sellos de tiempo asociados y me gustaría visualizarlos dinámicamente.
¿Existe software para hacer esto de manera efectiva? ¿Qué hay de las bibliotecas y los formatos de datos? Zoom-cache es un ejemplo de biblioteca que se centra en grandes series de tiempo. En Zoom-cache, los datos se resumen en varias resoluciones para facilitar la visualización en diferentes resoluciones.
Editar: también si hay algún otro lugar, debería hacer esta pregunta o buscar una respuesta, por favor hágamelo saber.
Respuestas:
Hay un conjunto de herramientas de investigación llamado TimeSearcher 1--3 que proporcionan algunos ejemplos de cómo lidiar con grandes conjuntos de datos de series de tiempo. A continuación se muestran algunas imágenes de ejemplo de TimeSearcher 2 y 3.
fuente
Perdón por el anuncio propio, pero Thunderplot (thunderplot.com) sería un buen candidato para ello. Lo escribí exactamente para el trazado interactivo de grandes conjuntos de datos. No lo probé con conjuntos de datos de 200KK filas, pero funciona bien con ~ 10KK filas. También hay una función de "leer cada enésima fila", por lo que puede reducir la cantidad de datos para almacenar / visualizar. Puedo enviarle la clave de registro a cambio de uno de esos grandes conjuntos de datos. :-)
fuente
Otra publicación de autopromoción porque trabajo para esta empresa, pero SensorCloud (sensorcloud.com) usa algoritmos inteligentes para graficar conjuntos de datos masivos muy rápidamente. Originalmente fue diseñado con nuestros sensores físicos en mente, pero tiene un cargador CSV para manejar cualquier información de series de tiempo.
Por ejemplo, subimos un conjunto de datos que tenía 100 mil millones de puntos de datos (más de 1 terabyte de marca de tiempo + valores de datos) y puede graficarlo e interactuar con él muy rápidamente.
Aquí hay un enlace público a ese conjunto de datos: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/
El enlace de arriba utiliza nuestro visor flash. Si no desea usar flash, aquí está el visor de JavaScript: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/js/
Use la rueda de desplazamiento, o Shift + clic izquierdo para acercar.
fuente