Estoy buscando graficar y explorar interactivamente datos en vivo / medidos continuamente. Existen bastantes opciones, y plot.ly es la más fácil de usar. Plot.ly tiene una interfaz de usuario fantástica y fácil de usar (fácilmente escalable, panoramizable, fácilmente ampliable / ajustable a la pantalla), pero no puede manejar los grandes conjuntos de datos que estoy recopilando. ¿Alguien sabe de alguna alternativa?
Tengo MATLAB, pero no tengo suficientes licencias para ejecutar esto simultáneamente y hacer desarrollo al mismo tiempo. Sé que LabVIEW sería una gran opción, pero actualmente tiene un costo prohibitivo.
¡Gracias por adelantado!
dataset
visualization
Clayton Pipkin
fuente
fuente
Respuestas:
Para esta respuesta, he asumido que prefiere soluciones de código abierto a la visualización de big data . Esta suposición se basa en los detalles presupuestarios de su pregunta. Sin embargo, hay una exclusión de esto: a continuación agregaré una referencia a un producto comercial, que creo que podría ser beneficioso en su caso (siempre que pueda pagarlo). También supongo que las soluciones basadas en navegador son aceptables (incluso las preferiría, a menos que tenga requisitos contradictorios específicos).
Naturalmente, el primer candidato como solución a su problema consideraría la biblioteca JavaScript D3.js : http://d3js.org . Sin embargo, a pesar de la flexibilidad y otros beneficios , creo que esta solución es de muy bajo nivel .
Por lo tanto, le recomendaría que eche un vistazo a los siguientes proyectos de código abierto para la visualización de big data , que son lo suficientemente potentes y flexibles , pero funcionan a un nivel más alto de abstracción (algunos de ellos se basan en la base D3.js y a veces son denominado pila de visualización D3.js ).
Por separado, me gustaría mencionar dos proyectos de análisis y visualización de big data de código abierto , centrados en datos de gráficos / redes (con algún soporte para la transmisión de datos de ese tipo): Cytoscape y Gephi . Si está interesado en alguna otra, más específica ( los mapas de apoyo, etc.) o comerciales (niveles básicos gratuitos), proyectos y productos, por favor ver esta compilación impresionante , que disfruté comisarié para llegar a la lista principal arriba y analizado : http://blog.profitbricks.com/39-data-visualization-tools-for-big-data .
Finalmente, como prometí al principio, Zoomdata , un producto comercial, que pensé que querrías visitar : http://www.zoomdata.com . La razón por la que lo excluí de mi compilación de software de código abierto se debe a su soporte integrado para plataformas de big data . En particular, Zoomdata proporciona conectores de datos para Cloudera Impala, Amazon Redshift, MongoDB, Spark y Hadoop, además de motores de búsqueda, motores de bases de datos principales y transmisión de datos.
Descargo de responsabilidad: no estoy afiliado a Zoomdata en absoluto; me impresionó su gama de opciones de conectividad (que puede costarle mucho, pero ese es otro aspecto del análisis de este tema).
fuente
Visualizar grandes conjuntos de datos es un problema de larga data. Uno de los problemas es comprender cómo podemos mostrar más de un millón de puntos en una pantalla que solo tiene alrededor de ~ millones de píxeles.
Dicho esto, aquí hay algunas herramientas que pueden manejar grandes datos:
fuente
Si está utilizando python, sugeriría usar mpld3 que combina las visualizaciones de JavaScript D3js con matplotlib de python.
La instalación y el uso es realmente simple y tiene algunos complementos geniales y cosas interactivas.
http://mpld3.github.io/
fuente