Buen recurso en línea con consejos para graficar la asociación entre dos variables numéricas en varias condiciones

22

Contexto:

Mientras tanto, he adquirido un conjunto de heurísticas sobre cómo trazar efectivamente la asociación entre dos variables numéricas. Me imagino que la mayoría de las personas que trabajan con datos tendrían un conjunto similar de reglas.

Ejemplos de tales reglas pueden ser:

  • Si una de las variables está sesgada positivamente, considere trazar ese eje en una escala logarítmica.
  • Si hay muchos puntos de datos (p. Ej., N> 1000), adopte una estrategia diferente, como usar alguna forma de transparencia parcial o muestrear los datos;
  • Si una de las variables toma un número limitado de categorías discretas, considere usar una fluctuación de fase o un diagrama de girasol;
  • Si hay tres o más variables, considere usar una matriz de diagrama de dispersión;
  • Ajustar alguna forma de línea de tendencia a menudo es útil;
  • Ajuste el tamaño del carácter de trazado al tamaño de la muestra (para n más grande, use un carácter de trazado más pequeño);
  • y así.

Pregunta:

Me gustaría poder referir a los estudiantes a una página web o sitio que explique estos y otros trucos para trazar efectivamente asociaciones entre dos variables numéricas, tal vez con ejemplos.

  • ¿Hay páginas o sitios en Internet que hagan un buen trabajo?
Jeromy Anglim
fuente
2
Si puede encontrarlo, el manual impreso "Gráficos" que vino con copias más antiguas de Systat (pre-Windows, lo creas o no) sería un excelente recurso. No solo ilustró todas estas reglas (como recuerdo), sino que también estuvo lleno de consejos contundentes y excelentes.
whuber
2
@whuber, un gran comentario. Leland Wilkinson, el autor principal de Systat, y también el autor de The Grammar of Graphics (que es más un libro de ciencias de la computación que un libro de estadísticas), tiene un gusto muy fino por la visualización gráfica de datos. Sus presentaciones son siempre muy efectivas en la entrega de sus mensajes.
StasK
@ Jeromy, es posible que ya conozca el paquete ggplot2 para R, pero ahora que se mencionó The Grammar of Graphics, pensé en mencionarlo también. Creo que el paquete, el libro y el manual de referencia en línea de Hadley Wickham son muy útiles para convertir variables numéricas en diagramas y gráficos útiles.
NRH
1
@Jeromy, ¿por qué no reformular la pregunta (por separado) como un wiki de la comunidad, solicitando una publicación por regla? De esa manera, en lugar de un conjunto de enlaces, podríamos tener un conjunto de reglas votables y crear el recurso aquí.
David LeBauer
@David Ok, agregué una pregunta wiki de la comunidad general sobre los mejores recursos para diseñar gráficos estadísticos.stackexchange.com
Jeromy Anglim

Respuestas:

13

No puedo pensar en grandes recursos en línea fuera de mi cabeza, pero un capítulo de libro agradable (y fácilmente descargable) que narra cómo explorar visualmente un conjunto de datos grandes y multidimensionales de una manera reflexiva es Brendan O'Connor y Lukas Biewald. capítulo (advertencia: el enlace es directamente a un PDF) de Beautiful Data . El capítulo es particularmente útil como recurso de enseñanza porque incorpora el código R en la narración.

Además, luego de una reflexión más profunda, creo que el clásico "Some Graphic and Semigraphic Displays" de John Tukey (convenientemente publicado en el sitio web de Edward Tufte) es una introducción a la visualización realmente maravillosa, aunque algo idiosincrática.

Por alguna razón, parece que estoy pensando en capítulos de libros ...

ashaw
fuente
+1 Al menos estos capítulos están disponibles en la Web: creo que eso califica. Gracias Aaron.
whuber
@ whuber gracias por publicar la recompensa; y @ashaw ambos enlaces hacen una lectura interesante.
Jeromy Anglim
Noté que el artículo de Tukey es un predecesor del tratamiento ampliado que se encuentra en su libro EDA (1977) (excepto la sección final sobre rootogramas e histogramas colgantes).
Whuber
11

Referencias recientes:

Recursos más antiguos pero relevantes

David LeBauer
fuente
3
+1 ¡Las reglas y los tutoriales se ven útiles, completos y prohibitivos! ¿Cómo es posible escribir sobre gráficos sin proporcionar una sola ilustración ? :-)
whuber
1
La elección fue difícil, pero he otorgado la recompensa a esta respuesta porque, en general, responde mejor a la pregunta tal como se hizo. El documento de la ONU parece ser especialmente útil y accesible para los estudiantes, con su lenguaje sencillo y muchos ejemplos claros.
whuber