Tengo un conjunto de datos de tamaño decente: 500,000 registros, cada uno de los cuales representa un evento.
Los campos son:
- fecha
- hora
- quien hizo el evento
- cuál fue el evento (habrá entre 5 y 10 tipos de eventos)
- donde estuvo el evento (habrá aproximadamente 20 ubicaciones para un evento)
- 'otras cosas'
Hay alrededor de 500-1000 eventos por día
Mi fantasía final sería tener un video vinculado a una determinada escala de tiempo: solo tiene 2 años de datos, así que haga el video (para discusión) 2 minutos, cada minuto es un año, y así sucesivamente. Cada ubicación se mostraría como un círculo de cierto tamaño que crecería a medida que los eventos 'sucedieran' en esas ubicaciones. Una versión aún más perversa de esta fantasía es donde cada círculo es un gráfico circular y los segmentos circulares crecen / se reducen según el tipo de evento en cada ubicación.
¿Hay algunas herramientas listas para usar, o bibliotecas de código abierto para Python, o un sitio web que alguien recomendaría?
¿Es este el tipo de cosas que contratas a alguien a un ritmo considerable para que lo haga por ti?
fuente
Respuestas:
Hay dos bibliotecas de JavaScript que pueden resultarle útiles para extraer algo como esto:
De lo contrario, hay muchas, muchas bibliotecas de gráficos que podría adaptar, algunas Flash, algunas PHP, algunas jQuery. Digg solía hacer algunas visualizaciones realmente geniales en los laboratorios Digg, pero desafortunadamente, todo lo que queda ahora después de su rediseño es este video .
fuente
Echa un vistazo a esta presentación de Hans Rosling.
Está disponible en gapminder.org y en Google Spreadsheets.
fuente
Como tiene ubicaciones, el resultado puede ser un mapa interactivo. El software de mapas interactivos de código abierto no es muy numeroso, pero puede generar imágenes estáticas y luego ensamblarlas en una animación.
Una gran combinación de software es R + python + FOSS GIS (código libre y abierto, como GRASS o QGIS). Algunos contenidos educativos introductorios se enumeran aquí: http://www.osgeo.org/educational_content
Como cartógrafo profesional, recientemente me pidieron que creara una herramienta de visualización en línea de valores cuantitativos espacializados como puntos, a lo largo del tiempo, y utilicé GeoExt lib, un puente entre el marco web Ext.JS de Sencha y el marco de mapeo OpenLayers, pero es Quizás un poco complicado.
fuente
Puede consultar esto: http://insideria.com/2009/12/28-rich-data-visualization-too.html
fuente
Hay una asombrosa variedad de posibilidades para el manejo de datos geoespaciales. De hecho, podrías usar Google Earth para esto. Google Earth tiene una línea de tiempo incorporada y una gran cantidad de funcionalidades. Ya no es independiente y se integra fácilmente en la web.
Aquí hay una larga lista de herramientas geoespaciales.
Gephi
Gephi en sí mismo es una herramienta de visualización de red, pero hay muchos complementos, también para geoespacial.
Gapminder Vea esta presentación fenomenal de TED por Hans Rosling - ama a ese chico
Gapminder se mencionó anteriormente, pero podría mencionarse fácilmente nuevamente :)
Cartas de Google
Los gráficos de Google pueden manejar big data, pero debe verificar las limitaciones y si tendría que pagar por una cuenta de big data.
somvis
Una herramienta bonita en minería de datos grandes conjuntos de datos.
Raphaël
También mencionado anteriormente. Que yo sepa, Raphael tiene algunas limitaciones en cuanto a datos realmente grandes.
MIT Exhibit (anteriormente llamado Similie)
Ha pasado un tiempo desde que jugué con Similie, pero recuerda que tienen capacidad para big data. Es posible que las imágenes no sean las más elegantes, pero que podrías hacer tú mismo.
d3
Uno de los buenos y antiguos, JavaScript altamente adaptable.
Highcharts
Muy profesional y versátil (me encanta que se vinculen directamente a jsfiddle para sus gráficos). Puede pagar por las soluciones de gama alta, y eso debería manejar fácilmente datos grandes y en vivo.
fuente