¿Sucesor moderno del análisis de datos exploratorios de Tukey?

52

He estado leyendo el libro de Tukey "Análisis de datos exploratorios". Escrito en 1977, el libro enfatiza los métodos de papel / lápiz. ¿Existe un sucesor más "moderno" que tenga en cuenta que ahora podemos trazar instantáneamente grandes conjuntos de datos?

biofreezer
fuente
¿Debería ser esto wiki comunitario?
richiemorrisroe
No me queda claro si esto debería ser CW. Puede que no haya buenas respuestas; puede haber una respuesta clara y destacada; Podríamos generar una larga lista de respuestas efectivas. Veamos qué pasa.
whuber
44
Esta es una buena pregunta, biofreezer. Solo quería comentar que existen analogías cercanas con otros métodos de trabajo. Mi favorito es que el lápiz y papel EDA es para las estadísticas modernas como las herramientas manuales para la carpintería moderna. (La carpintería "moderna" emplea muchas herramientas eléctricas como sierras de mesa y enrutadores que permiten incluso a los principiantes obtener resultados aceptables en mucho menos tiempo. Sin embargo, estas herramientas también representan miles de dígitos y extremidades faltantes cada año. Personas que aprenden a usar herramientas manuales generalmente aprenden a trabajar mejor y más eficientemente incluso cuando emplean herramientas eléctricas.)
whuber
44
Sí, la carpintería es una buena analogía (dígitos faltantes, dígitos faltantes). Ver también software-carpentry.org .
denis

Respuestas:

19

Lo más cercano son los datos de visualización de Cleveland . Se trata de análisis de datos exploratorios, se trata de visualizaciones generadas por computadora, es profundo, es un clásico.

Carlos Accioly
fuente
2
Lo mismo también se aplica al libro The Elements of Graphing Data del mismo autor. Compre los dos; Ambos son excelentes.
Karl Ove Hufthammer
4

Aquí vale la pena mencionar los datos de exploración de Ronald Pearson en ingeniería, ciencias y medicina . Parece que su público objetivo principal son los científicos que no temen un poco de matemática y desean saber más estadísticas. Ese es un grupo bastante grande, y uno bien representado aquí. Es un poco peculiar y poco convencional, pero cubre mucho terreno e incluye muchos consejos razonables. No se vuelve a visitar a Tukey en el sentido de que ofrece muchas ideas nuevas, pero puede ser gratificante estudiar, incluso cuando piensas que está un poco equivocado.

Este libro parece haber atraído muy poca atención, posiblemente porque es muy costoso, obviamente no es adecuado como texto del curso y, por el momento, solo está disponible en tapa dura. Pero es inteligente, legible y está libre de la basura de los libros de texto de introducción modernos (páginas y páginas de ejercicios elementales, iconos tontos, fotos gratuitas de jóvenes felices, diseño quisquilloso con cajas, lo que sea, etc.).

Nick Cox
fuente
0

Otro par de buenos libros para leer son Beautiful Visualization y Beautiful Data. Estos son libros editados, hay ejemplos increíblemente buenos de exploración de datos con tramas y algunos capítulos absolutamente atroces.

Otro libro que tiene algunos buenos ejemplos de uso de ggplot2 es uno nuevo de Winston Chang

Dianne Cook
fuente
1
Solo quiero verificar dos veces, Di, en caso de que aparezca un error tipográfico sutil: ¿querías escribir "atractivo" en lugar de "atroz"? Aunque ambos tienen sentido en este contexto, la aparición de este último, sin más explicaciones, ¡es más bien una sorpresa!
whuber
2
espantoso era correcto - es una mezcla de mezcla - los volúmenes editados a menudo lo son
Dianne Cook
Estoy sorprendido por estas recomendaciones. Los dos libros me parecieron decepcionantes (mucho en guff, cortos en gráficos). Desafortunadamente, O'Reilly, que encontré por primera vez como editor de libros de Unix espectacularmente buenos, parece tener un control de calidad muy desigual para libros sobre cualquier cosa, incluso remotamente estadística.
Nick Cox
Me gustan ambos libros, y realmente siento que son contribuciones sustanciales. Winston Chang tiene muchos detalles básicos sobre cómo trazar con ggplot2. Es una buena referencia para principiantes. No te dice mucho sobre por qué harías estas tramas, pero la mayoría tiene sentido para el propósito, a partir de las piezas que he leído. The Beautiful Visualization tiene algunos capítulos muy impresionantes, que abordan problemas difíciles como visualizar wikipedia, datos masivos, muchas complejidades, y pasa por el proceso de pensamiento / decisiones tomadas para hacer los argumentos.
Dianne Cook
Por si acaso mi comentario es ambiguo: me refería a los libros "Hermosos". El libro de Winston Chang es agradable y útil.
Nick Cox
0

Pienso en comprender el análisis robusto y exploratorio de Hoaglin, Mosteller y Tukey, el volumen complementario de Exploración de tablas y formas de datos como el seguimiento técnico de EDA. También veo análisis y regresión de datos, un segundo curso en estadística de Mosteller y Tukey como seguimiento de EDA. Los diversos libros de Cleveland mencionados anteriormente son tesoros.

SJC
fuente