He estado leyendo el libro de Tukey "Análisis de datos exploratorios". Escrito en 1977, el libro enfatiza los métodos de papel / lápiz. ¿Existe un sucesor más "moderno" que tenga en cuenta que ahora podemos trazar instantáneamente grandes conjuntos de datos?
data-visualization
references
descriptive-statistics
eda
biofreezer
fuente
fuente
Respuestas:
Lo más cercano son los datos de visualización de Cleveland . Se trata de análisis de datos exploratorios, se trata de visualizaciones generadas por computadora, es profundo, es un clásico.
fuente
Bueno, no es una réplica exacta, pero encontré toneladas de consejos útiles de trazado (y código R) en el análisis de datos de Gelman y Hill usando modelos de regresión y multinivel / jerárquicos
Además, su blog a menudo está lleno de consejos gráficos útiles.
fuente
Gráficos interactivos para el análisis de datos: principios y ejemplos es uno que me gusta; la descripción del libro dice que "discute el análisis exploratorio de datos (EDA) y cómo los métodos gráficos interactivos pueden ayudar a obtener información y generar nuevas preguntas e hipótesis a partir de conjuntos de datos".
fuente
El libro ggplot2 de Hadley Wickham es interesante porque enseña tanto la Gramática de Gráficos como cómo usar el software ggplot2.
fuente
Aquí vale la pena mencionar los datos de exploración de Ronald Pearson en ingeniería, ciencias y medicina . Parece que su público objetivo principal son los científicos que no temen un poco de matemática y desean saber más estadísticas. Ese es un grupo bastante grande, y uno bien representado aquí. Es un poco peculiar y poco convencional, pero cubre mucho terreno e incluye muchos consejos razonables. No se vuelve a visitar a Tukey en el sentido de que ofrece muchas ideas nuevas, pero puede ser gratificante estudiar, incluso cuando piensas que está un poco equivocado.
Este libro parece haber atraído muy poca atención, posiblemente porque es muy costoso, obviamente no es adecuado como texto del curso y, por el momento, solo está disponible en tapa dura. Pero es inteligente, legible y está libre de la basura de los libros de texto de introducción modernos (páginas y páginas de ejercicios elementales, iconos tontos, fotos gratuitas de jóvenes felices, diseño quisquilloso con cajas, lo que sea, etc.).
fuente
También gráficos interactivos y dinámicos para el análisis de datos: con ejemplos que usan R y GGobi, Cook y Swayne
Tiene dos capítulos disponibles públicamente en la web que describen el proceso de análisis de datos y el manejo de los valores faltantes. Pronto saldrá un nuevo libro de Antony Unwin.
fuente
Otro par de buenos libros para leer son Beautiful Visualization y Beautiful Data. Estos son libros editados, hay ejemplos increíblemente buenos de exploración de datos con tramas y algunos capítulos absolutamente atroces.
Otro libro que tiene algunos buenos ejemplos de uso de ggplot2 es uno nuevo de Winston Chang
fuente
Pienso en comprender el análisis robusto y exploratorio de Hoaglin, Mosteller y Tukey, el volumen complementario de Exploración de tablas y formas de datos como el seguimiento técnico de EDA. También veo análisis y regresión de datos, un segundo curso en estadística de Mosteller y Tukey como seguimiento de EDA. Los diversos libros de Cleveland mencionados anteriormente son tesoros.
fuente