Recursos para aprender a usar (/ crear) visualización estadística dinámica (/ interactiva)

14

Me gustaría aprender un poco más sobre la visualización interactiva de datos (zoom, apuntar, pincel, mapeo de puntos, etc.). Agradecería cualquier:

  1. Tutorial / guía / libro (?) / Video sobre cómo usar dichos métodos para la exploración estadística.
  2. Punteros para paquetes de datos interactivos buenos / interesantes (en R y fuera de él)

Solo para comenzar a rodar la pelota, sé que en R hay varias formas de obtener una visualización interactiva, como rggobi , el nuevo paquete googleViz R , el paquete de animación y algunos otros. Pero si hay otros paquetes que vale la pena explorar (que ofrecen cosas que R no ofrece), me encantaría saber acerca de ellos (como jmp, mathlab, spss, sas, excel, etc.).

ps: esta es la primera pregunta para usar la etiqueta "visualización interactiva"

Tal Galili
fuente
Supongo que @Shane tendrá algo que decir aquí mientras habla de webvis (analizador de protovis) ya que protovis (dedicado a la visualización web) ( vis.stanford.edu/protovis ) contiene la posibilidad de gráficos interactivos ...
robin girard
En R, también hay iPlots y Rgl , pero las soluciones basadas en Javascript o Python pueden ser más flexibles.
Vincent Zoonekynd

Respuestas:

13

Además de Protovis (HTML + JS) o Mayavi (Python), recomendaría Procesar, que es

Un lenguaje de programación de código abierto y un entorno para personas que desean crear imágenes, animaciones e interacciones. Inicialmente desarrollado para servir como un cuaderno de bocetos de software y para enseñar los fundamentos de la programación de computadoras dentro de un contexto visual.

Hay muchos scripts de código abierto en http://www.openprocessing.org/ , y muchos libros relacionados que tratan sobre el procesamiento pero también la visualización de datos.

Sé que hay un proyecto para proporcionar una interfaz R, rprocesamiento , pero no sé cómo funciona. También hay una interfaz con clojure / incanter (consulte, por ejemplo, Creación de visualizaciones de procesamiento con Clojure e Incanter ).

Hay muchos recursos en línea, entre los que se incluyen los apuntes de clase de Stanford, por ejemplo, CS448B , o 7 documentos visuales básicos clásicos que quizás no quieras confesar públicamente que no sabes .

chl
fuente
6

Algunos paquetes más para agregar a la sugerencia de Chl de Procesamiento para crear visualizaciones interactivas. Todos estos están basados ​​en JavaScript y pueden ejecutarse en un navegador, por lo que se pueden usar para publicar y para su propio análisis:

  • D3.js es el sucesor de Protovis. Es más poderoso porque tiene más control sobre los objetos creados (son objetos DOM apropiados, es decir, tiene control total sobre ellos usando javascript), pero algunos prefieren Protovis por simplicidad. Buena discusión técnica D3 vs Protovis aquí .
  • Raphael.js es una buena opción para la interactividad web de mercado masivo altamente personalizada, ya que es a prueba de futuro (sin flash) y funciona en navegadores tan antiguos como IE6 (lo único que no funciona es de versiones antiguas de el navegador de Android). Al igual que D3, todo es un objeto DOM orientable y tiene buenos controles api construidos para animación e interactividad. No ofrece nada fuera de la caja que sea específico para la visualización: es una pizarra en blanco muy potente y flexible, una gran opción para diseñar visualizaciones personalizadas, pero no para su propio análisis exploratorio inicial. Conozca primero sus datos.
  • gRaphael.js es gráficos estándar (barra, línea, etc.) para Raphael. Es básico pero funciona y se puede construir sobre él; podría ser un ingrediente útil si está creando su propia suite.

Con respecto a su otra pregunta sobre el aprendizaje, para principios generales, el Diseño del Tablero de Información merece una mención, si lo que desea es hacer una serie de herramientas estándar interactivas de propósito general para sus datos.

Las visualizaciones interactivas están en la línea entre las estadísticas y el diseño de interactividad : por lo tanto, los libros sobre eso pueden ser útiles. No tengo ninguna experiencia personal de ninguno de los muchos libros de texto de diseño de interacción, pero soy un gran admirador de los Principios Universales de Diseño . Puede ser excesivo para sus necesidades, pero considere mirar la columna de usabilidad en su excelente página de contenido categórico y leer los capítulos enumerados (divulgación progresiva, señal a ruido, etc.).

Además, para cualquier persona nueva en la programación, Programming Interactivity es un buen lugar para comenzar a reforzar sus habilidades técnicas (también incluye un capítulo importante sobre Procesamiento).

Pero para saber qué funciona y qué es posible, no se puede superar el aprendizaje haciendo , y un buen comienzo podría ser considerar seguir y analizar los paquetes de visualización interactiva de propósito general de gran nombre y precio como tableau y jmp y piense por qué sus características están diseñadas de la forma en que están.

user56reinstatemonica8
fuente
Gracias por editar en los enlaces whuber - ¡golpéame!
user56reinstatemonica8
4

Además de Processing, revisa el Nodebox basado en Python (1, 2, OpenGL), que se inspiró en Processing:

Nodebox 1 es solo para Mac, mientras que Nodebox 2 y la versión OpenGL son multiplataforma.

Python tiene una tonelada de bibliotecas de procesamiento de datos que se pueden importar a Nodebox, por ejemplo, scipy.org

Ed Hagen
fuente
1

Como un enfoque separado de las respuestas existentes, poco después de publicar mi primera lista larga, WEAVE surgió: un conjunto de visualización de datos dedicado de código abierto. Aquí hay una breve reseña sobre WEAVE en los datos líderes del blog Flowing Data

Es aconsejable adoptar un enfoque diferente para la visualización de datos dependiendo de dónde se encuentre en el proceso. Cuanto antes sea, cuanto más crudos e inexplorados sean sus datos, más probabilidades tendrá de beneficiarse de suites prefabricadas, flexibles y de uso general como WEAVE y sus contrapartes comerciales de código cerrado como Tableau y JMP: puede probar las cosas rápidamente y sin dolor para conocer los datos y descubrir qué líneas de ataque tomar para sacar el máximo provecho de ellos.

A medida que descubra más sobre los datos, es probable que su enfoque se desplace hacia la comunicación o la 'exploración guiada': visualizaciones de datos exploratorios más personalizadas diseñadas en función de las advertencias, los matices y las áreas de interés que ahora ha descubierto en los datos. Aquí es donde los productos de pizarra en blanco, como las herramientas programáticas de dibujo vectorial enumeradas anteriormente, entran en juego.

user56reinstatemonica8
fuente