¿Recursos para aprender a crear visualizaciones de datos?

19

Estoy interesado en aprender cómo crear el tipo de visualizaciones que ves en http://flowingdata.com e informationisbeautiful. EDITAR: Significado, visualizaciones que son interesantes en sí mismas, algo así como los gráficos del NY Times, en lugar de algo rápido para un informe.

¿Qué tipo de herramientas se utilizan para crearlas? ¿Se trata principalmente de Adobe Illustrator / Photoshop? ¿Cuáles son buenos recursos (libros, sitios web, etc.) para aprender cómo usar estas herramientas para la visualización de datos en particular?

cómo quiero que se vean las visualizaciones (y estoy familiarizado con los principios de diseño, por ejemplo, de los libros de Tufte), pero no tengo idea de cómo crearlos.

revs raegtin
fuente

Respuestas:

20

Los datos que fluyen discuten regularmente las herramientas que usa. Ver, por ejemplo:

También muestra con gran detalle cómo hace gráficos en ocasiones, como:

También hay otras preguntas en este sitio:

OMI, prueba:

  1. R y ggplot2: este es un buen video introductorio , pero el sitio web ggplot2 tiene muchos recursos.
  2. Procesamiento: muchos buenos tutoriales en la página de inicio .
  3. Protovis: también una gran cantidad de excelentes ejemplos en la página de inicio .

Puede usar Adobe luego para limpiarlos.

También puede ver el webvispaquete R , aunque no es tan completo como ggplot2. Desde R, puede ejecutar este comando para ver el ejemplo de Trigo de Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Por último, mis aplicaciones comerciales favoritas para la visualización interactiva son:

Shane
fuente
1
Impresionante, excelentes enlaces! Ya uso R y ggplot2, pero las visualizaciones a partir de ahí parecen más de la variedad de "gráficos para un informe", que de la variedad de "visualizaciones / visualizaciones interesantes en sí mismas" que estoy buscando. (ggplot2 es súper hermoso, pero en realidad no está destinado a permitir una creatividad ilimitada). ¿Me equivoco ?, ¿o a veces usas R / ggplot2 como entrada en otra herramienta de visualización?
raegtin
5

El procesamiento ya mencionado tiene un buen conjunto de libros disponibles. Ver: 1 , 2 , 3 , 4 , 5 , 6 , 7

Encontrará muchas cosas en la web para ayudarlo a comenzar con R. Como siguiente paso, ggplot2 tiene una excelente documentación web . También encontré el libro de Hadley muy útil.

Python podría ser otro camino a seguir. Especialmente con herramientas como:

Todos los proyectos están bien documentados en la web. También podrías considerar echar un vistazo a algunos libros .

Por último, el libro Gráficos de grandes conjuntos de datos también podría ser de alguna ayuda.

radek
fuente
igraphtrabaja en R también; para 3D acelerado openGL vis en R, uso rgly misc3dpaquetes.
También las matplotlibtramas son feas; pueden ser agradables para un usuario de gnuplot de muchos años.
2

Pasarás mucho tiempo poniéndote al día con R.

RapidMiner es gratuito y de código abierto y gráfico, y tiene muchas visualizaciones buenas, y puede exportarlas.

Si tienes dinero de sobra, o eres un empleado / estudiante de la universidad, entonces JMP también es muy agradable. Puede hacer algunos gráficos muy bonitos, muy muy fácilmente. Puede exportar a flash o PNG o PDF o lo que tenga.

Neil McGuigan
fuente
55
1. En mi humilde opinión, el tiempo que pasas con R está bien invertido si planeas hacer algo serio. 2. Considere también KNIME knime.org como la alternativa RapidMiner.
radek
(+1) @radek. También soy un fanático de los mineros rápidos, pero en mi opinión no es lo suficientemente flexible para visualizaciones sofisticadas.
steffen
Si tiene alguna experiencia en codificación, entonces realmente no necesitará más de un día para ponerse al día con R. Es bastante sencillo, en lo que respecta a los idiomas, y hay algunos excelentes tutoriales en línea.
nada101
1

Otra buena alternativa es la biblioteca de protovis http://vis.stanford.edu/protovis/

Es una biblioteca JavaScript muy bien diseñada que puede crear algunas visualizaciones hermosas si tiene el tiempo y la capacidad de escribir la cantidad modesta de código JavaScript necesaria.

También recomiendo Tableau http://www.tableausoftware.com . Es ideal para explorar rápidamente conjuntos de datos y crear muchas visualizaciones diferentes.

Ambos productos tienen raíces en el Stanford Visualization Group.

Alex Blakemore
fuente
1

Aquí se han dado muchas respuestas excelentes, y los idiomas / bibliotecas que elija aprender dependerán del tipo de visualización que le gustaría hacer.

Sin embargo, si usa Python regularmente, le recomiendo seaborn . Es muy sofisticado cuando se trata de visualización de datos estadísticos, pero también se ve bastante sofisticado desde el punto de vista de la presentación.

Pongamos un ejemplo. Suponga que está tratando de trazar el consumo de electricidad de un edificio comercial por mes. Se podría generar un gráfico lineal simple en matplotlib para este propósito.

Sin embargo, si quisiéramos hacer la visualización más sofisticada e informativa, podríamos generar un mapa de calor con seaborn:

mapa de calor

Un mapa de calor es solo un ejemplo. Algunos otros usos comunes con seaborn incluyen:

  • Parcelas de KDE
  • Parcelas de enjambre
  • Parcelas de violín

La idea detrás de seaborn es presentar los datos de una manera más intuitiva de lo que sería posible mediante el uso de gráficos más simples, por ejemplo, línea, barra, pastel, etc.

Si le interesa, puede encontrar más información sobre seaborn aquí: https://seaborn.pydata.org/

Michael Grogan
fuente
0

R es genial, pero no es que R sea ​​difícil de aprender, es que la documentación es imposible de buscar, ya que Rq sería genial. Entonces, cuando tienes un problema, buscar una solución es una pesadilla, y la documentación tampoco es excelente. Matlab u Octave serán geniales. Y conseguir esas parcelas en R o Matlab sería muy tedioso.

En mi humilde opinión, el procesamiento visual es la mejor ruta. Muchos de ellos de datos que fluyen se pasan a través de Adobe Illustrator o Gimp. Es mas rapido. Una vez que obtenga la estructura de la trama, cambie los detalles en un editor. Usar R como editor no le brinda la flexibilidad que desea. Te encontrarás buscando nuevos paquetes todo el tiempo.

Vass
fuente
R; function??- R tiene ayuda incorporada. normalmente también puedes buscar "cran" para encontrar cosas R, y creo que la mayoría de los motores de búsqueda más importantes pueden manejar la letra lo suficientemente bien.
nada101
0

Aquí hay un tutorial de YouTube sobre D3.js que enseña los conceptos básicos de HTML, SVG, CSS y JavaScript, así como cómo cargar datos y crear un gráfico de barras, gráfico de líneas y diagrama de dispersión con D3.js.

Miniatura de video

curran
fuente
-3

Hay infinitos recursos, pero puede reducirlos en función de cómo desea que se transformen sus datos, cuántas fuentes de datos está tratando, cómo deben compartirse, etc.

Aquí hay una guía sobre cómo elegir el recurso correcto que podría ayudarlo a orientarse en la dirección correcta.

Scott Morris
fuente
1
Como estás asociado con este grupo, declara un interés. Las respuestas de solo enlace no son las más útiles. Pueden aplicarse los consejos de stats.stackexchange.com/help/promotion .
Nick Cox