¿Qué libro es recomendable para comenzar a aprender estadísticas usando R al mismo tiempo?

50

Libros para aprender estadísticas usando R

¿Cuál es exactamente el libro que estoy buscando?

Lo que estoy buscando es un libro que le enseñe estadísticas mientras usa R para brindarle experiencia práctica y, por lo tanto, termine ayudándolo a aprender R juntos. He visto en Amazon muchos libros que intentan hacer eso, pero no con R. Los ejemplos son Minitab y SAS.

¿Son una opción el libro R y la computación estadística? - Aún no contestado .

El libro R y la computación estadística: una introducción al análisis de datos usando S-Plus parece viable, pero la opinión de un lector aquí sería útil y bienvenida.

¿Cómo se relaciona el libro con los cursos de estadística?

Para ser aún más preciso sobre lo que estaba buscando, considere estos dos cursos de resultados de aprendizaje en estadísticas de un departamento de matemáticas de la universidad. Actualmente soy estudiante:

Estadística intermedia y Probabilidad y estadística , es decir, estoy buscando en un libro un curso de estadística normal que vaya a un nivel intermedio, en lugar de solo pizarra y papel para que aprenda y use R en su lugar. Eso también significa que estoy buscando un libro que asuma que quiero aprender estadísticas desde el principio.

Este libro también es para investigadores.

También soy un investigador ingeniero de software, pero supongo que la situación actual en la que te encuentras con montañas de datos y quieres aprender estadísticas para seguir escribiendo código para automatizar es bastante aplicable a muchos otros campos.

Eso significa que no estoy interesado en aprender cada detalle de cada propiedad para cada curva, pero estoy más preocupado por dar sentido a los datos para mi dominio de investigación, aunque no me importaría si el libro quisiera profundizar en eso .

Como motivación final, me encuentro leyendo artículos científicos en diferentes tipos de comunidades que afirman resultados basados ​​en inferencia estadística, mientras que no hay pruebas legibles de si las presunciones / restricciones estadísticas están siendo violadas o no.

El libro AR que no se trata mucho de estadísticas no garantizará que no esté siguiendo esta práctica, por lo que también decidí buscar un libro similar a un curso de estadística usando R en lugar de jugar con un libro de resumen.

Preguntas relacionadas en Cross Validated.

Respuestas y comentarios para esta pregunta.

@Julie

Ya he encontrado pocos libros sugeridos, pero son un ejemplo que desafortunadamente no me conviene:

Estadísticas introductorias con R , usando R para estadísticas introductorias , estadísticas: una introducción usando R son algunos de los libros que ya miré en Amazon, pero que tratan sobre una visión general de estadísticas o suposiciones que requieren conocimientos previos de estadísticas. El problema con los libros de resumen es sobre todo no llamar la atención sobre los supuestos, las restricciones y proporcionar una explicación suficiente para dar sentido a la información.

Si cree que no hay un libro que también se ajuste a esta necesidad o cree que el libro R o la Computación estadística: una introducción al análisis de datos utilizando S-Plus encajaría en esto, también agradecería este tipo de respuesta.

@Christopher Aden

Introducción a la probabilidad y las estadísticas El uso de R parece ser el más cercano pero, en general, amplio a lo que estaba buscando.

Lo que esperaba era un libro como David S. Moore, The Basics of Statistics porque:

  • Cubre todos los temas estadísticos.
  • Utiliza dos herramientas, miniTab y otras para dar un aprendizaje práctico sobre el método recién explicado.
  • Destaca mucho los supuestos y las limitaciones. Esto es muy importante para un investigador que no ha tomado un curso de estadística en profundidad y quiere usar estadísticas. Apenas los libros de resumen los cubrirán, lo cual es peligroso para los investigadores.
    • Puede ver la tabla de contenido del libro aquí . Observe cómo el enfoque son las estadísticas y el uso de la herramienta es para mejorar la comprensión y hacer que el alumno sepa cómo usar las herramientas para hacer las estadísticas después de aprender de una manera más fácil. ¡No se trata de la herramienta, se trata de estadísticas!

Quiero exactamente lo mismo, pero usando R.

@Gregory Demin

Utiliza R como ejemplos pedagógicos, supone que desea aprender estadísticas y, lo mejor de todo, es de código abierto. Desafortunadamente, no cubre ANOVA ni ANCOVA, ni temas más avanzados.

@Peter Ellis

Buena sugerencia para un libro de texto que cubra lo que se quiere en esta pregunta.

Libros en la opinión del autor que responden la pregunta.

@Peter Ellis y @Gregory Demin.

Colección de libros R en Amazon

La discusión de Amazon sobre los libros R para diferentes antecedentes de estudiantes se puede encontrar aquí .

Conferencias de video que enseñan estadísticas usando R

Google Tech Talks de 2007 que también motivó esta pregunta y cubre más sobre Minería de datos en lugar de estadísticas, pero usando R juntos aquí .

rev. Oeufcoque Penteano
fuente

Respuestas:

15

Creo que una razón por la que es tan difícil responder esto es que R es tan potente y flexible que una introducción real a la programación de R va mucho más allá de lo que normalmente se necesita en una introducción a las estadísticas. Los libros que enseñan estadísticas usando MiniTab, JMP o SPSS están haciendo cosas relativamente sencillas con el software que apenas rasca la superficie de lo que R es capaz cuando se trata de manipulación de datos, simulaciones, funciones personalizadas, etc.

Dicho esto, creo que las estadísticas modernas de Wilcox para las ciencias sociales y del comportamiento: una introducción práctica (2012) es un libro nuevo y brillante. No asume ningún conocimiento estadístico y lo lleva desde cero hasta una gran variedad de técnicas modernas y robustas; y supone no mucho más conocimiento de R que la capacidad de abrirlo y cargar un conjunto de datos. Cubre muchas de las técnicas clásicas, incluido ANOVA (mencionado en el OP).

Vería este libro como el equivalente de los libros que presentan estadísticas y un paquete de estadísticas como SPSS al mismo tiempo. Sin embargo, no le enseñará a programar en R, solo cómo hacer análisis estadísticos modernos con él, con énfasis en técnicas robustas que aborden los problemas conocidos con el análisis clásico que están marginados por la mayoría de los otros enfoques para enseñar estadísticas.

Los tres problemas con los métodos clásicos que este libro aborda particularmente desde el principio son el muestreo de distribuciones de cola pesada; oblicuidad; y heteroscedasticidad.

Wilcox usa R porque "en términos de aprovechar las técnicas estadísticas modernas, R domina claramente. Al analizar datos, es sin duda el desarrollo de software más importante durante el último cuarto de siglo. Y es gratis. Aunque los métodos clásicos tienen fallas fundamentales , no se sugiere que sean completamente abandonados ... En consecuencia, se proporcionan ilustraciones sobre cómo aplicar métodos estándar con R. De particular importancia aquí es que, además, se proporcionan ilustraciones sobre cómo aplicar métodos modernos utilizando más de 900 R funciones escritas para este libro ".

Este libro es tan excelente que después de comprar una copia para el trabajo, compré mi propia copia en casa.

Los títulos de los capítulos son:

  1. resúmenes numéricos y gráficos de datos;
  2. probabilidad y conceptos relacionados;
  3. distribuciones de muestreo e intervalos de confianza;
  4. evaluación de la hipótesis;
  5. regresión y correlación;
  6. métodos de arranque;
  7. comparando dos grupos independientes;
  8. comparar dos grupos dependientes;
  9. ANOVA unidireccional;
  10. diseños bidireccionales y tridireccionales;
  11. comparar más de dos grupos dependientes;
  12. comparaciones múltiples;
  13. algunos métodos multivariados;
  14. regresión robusta y medidas de asociación;
  15. métodos básicos para analizar datos categóricos;

Edición adicional : después de ver el ejemplo de David Moore de lo que está buscando, realmente creo que el libro de Wilcox satisface la necesidad.

Peter Ellis
fuente
1
Muchas gracias, estoy feliz de obtener otra referencia que también está disponible como un tomo imprimible. ¡Editaré la publicación principal más tarde para incluir su referencia si nadie lo hace en este momento! Realmente muy apreciado. Solo para confirmar, ¿quiere decir que le enseña a trazar la teoría que se menciona? ¡Eso está más que bien para mí! Por favor confirmar.
Oeufcoque Penteano
No estoy muy seguro de lo que quieres decir con "trazar la teoría", pero ciertamente hace un uso extensivo de las tramas y tiene el código R para hacer todas las teorías que cubre (tanto la inferencia estadística como la trama). Wilcox también proporciona su propio paquete de funciones o referencias a otros para los enfoques robustos de vanguardia desarrollados en las últimas décadas. Cada técnica viene con ejemplos que incluyen código. He editado la respuesta para incluir encabezados de capítulos.
Peter Ellis
¡Sí, lo entendiste bien! Las piezas de código que me ayudan a hacer toda la teoría sobre R serían muy bienvenidas y necesarias en lo que estoy investigando. Gracias por proporcionar la lista! También necesitaba un libro que hablara sobre bootstrap. Ya estoy ordenando este libro. Editaré la publicación principal pronto.
Oeufcoque Penteano
Ya estoy hojeando este libro. +500 en esta sugerencia, EXACTAMENTE lo que estaba buscando: un gran tomo lleno de información sobre estadísticas y la función adecuada para usarlo en R (¡que es gratis y de código abierto yay!). Es muy económico para el tamaño de este libro y su singularidad. No te asustes por estar a favor de las ciencias del comportamiento. Lo estoy usando a pesar de que soy un estudiante de CS. Encontré que los libros de estadísticas de comportamiento son incluso más útiles para mí que los de estadísticas para comprender lo que está sucediendo. No digo que una estadística pura sea inútil, la necesitas. Usé Paul Meyer (1965).
Oeufcoque Penteano
6

Puede ser "Introducción al pensamiento estadístico" ?

Gregory Demin
fuente
1
Gran sugerencia, consideraré esta una respuesta válida si no hay más respuestas sobre esto, ya que esta todavía no cubre conceptos más avanzados como ANOVA (o al menos eso es lo que sugiere buscar). Grande para ser libre, así ..
Oeufcoque Penteano
4

La publicación de @ Julie del libro de Verzani es una muy buena opción para alguien que no tiene experiencia en estadísticas o R. Es lo suficientemente suave tanto en la R como en las estadísticas que usa el departamento de ciencias políticas de UC Davis, y esos estudiantes no tienen clases de programación ni matemáticas de nivel superior. Su trabajo está disponible a través de su paquete CRAN, simpleR .
Dado que usted proviene de una formación en informática, no creo que necesite una introducción muy amable a R. Supongo que tiene un conocimiento decente de las estructuras de datos, el alcance y por qué necesita un depurador. Para obtener una perspectiva muy centrada en la computación sobre R (más de lo que podría incluso ver en una clase de programación estadística en un departamento de estadística de pregrado), consulte Norm Matloff's The Art of R Programming. Para ver si le interesa, Matloff tiene una versión preliminar previa a la impresión disponible en su sitio web . Si te gusta su estilo, recomendaría agarrar la copia terminada. Es profesor de CS y escribe el libro más para una audiencia de CS que para una audiencia de estadísticas.
G. Jay Kerns (un cartel frecuente aquí) también tiene un libro disponible en línea llamado Introducción a la Probabilidad y Estadística con R . Personalmente, creo que es un servicio maravilloso presentar las tripas de R.
Me doy cuenta de que su pregunta está dirigida a obtener respuestas dirigidas a una especialidad de CS, pero también lea detenidamente este tema: ¿Qué libro recomendaría para los científicos no estadísticos?

Christopher Aden
fuente
1
Creo que la Introducción a la probabilidad y las estadísticas usando R es la más cercana, pero aún no es la que estoy buscando. Estoy editando la pregunta en un segundo para dar una referencia de exactamente lo que estoy buscando, pero desafortunadamente usa miniTab en lugar de R. El Programa de Arte de R parece estar más preocupado por R que por el hecho de aprender estadísticas (corríjame si estoy mal), y nuevamente el libro anterior me preocupa por ser lo suficientemente riguroso en las estadísticas para hacer suposiciones de antecedentes estadísticos, lo que, lamentablemente, me falta. También resumiré los puntos principales.
Oeufcoque Penteano 01 de
Tienes razón sobre TAoRP: pone más énfasis en la programación que en el aprendizaje de estadísticas. Sin embargo, estoy un poco confundido por tu pregunta. A menos que desee comenzar a aprender estadísticas matemáticas, debe hacer algunas suposiciones y tomarlas con fe, al menos brevemente. ¿Desea un libro que introduzca estadísticas, ejemplos en R y no pase por alto los supuestos? La mayoría de los libros de introducción proporcionarán cierta intuición detrás de los supuestos de modelado, pero es posible que no formalicen la lógica. Necesitará leer un libro de estadísticas de matemáticas para eso, probablemente.
Christopher Aden el
Consulte el libro que acabo de mencionar en mi última edición sobre la pregunta. Hace exactamente lo que quería. De hecho, la pregunta surgió de la lectura de piezas de este libro. Quiero lo mismo, pero con R. También destaqué en viñetas lo que es tan importante en el libro de la gran parte de motivación para aquellos que nunca se encontraron con el libro. Espero que esté claro ahora. La tabla de contenido del libro se puede ver aquí también whfreeman.com/Catalog/product/…
Oeufcoque Penteano
3

Encontré que este libro es de gran utilidad, pero asume cierto conocimiento de términos estadísticos básicos, como el valor p, ANOVA, etc.

Este libro ofrece una introducción mucho más suave a los conceptos estadísticos mismos ...

Julie
fuente
+1. El libro de Verzani es una introducción muy amable, y también está disponible en su paquete CRAN. El libro de Dalgaard también es bueno, y ciertamente habla como un experto, ¡no siendo un extraño en el mundo R!
Christopher Aden el
@ChristopherAden: ¿qué libro recomendaría para construir una base sólida para pensar en estadísticas conceptualmente, sin profundizar (en absoluto, realmente) en las matemáticas en sí?
Julie
@ Julie, ¿cuál es tu especialidad? Uno de esos días recibí un libro de 1979 sobre estadísticas para estudiantes de sociología de un profesor social. A veces son más útiles, aunque un profesor mencionó en comentarios de Amazon que tienden a cometer más errores especialmente en fórmulas que son peligrosas para los profesores que no están demasiado
metidos
Julie: Definitivamente es una pregunta que investigaré para dar mejores recomendaciones. Aprendí de Estadística: El arte y la ciencia del aprendizaje de los datos, de Agresti y Franklin. Encontré que su enfoque basado en aplicaciones es excelente. No ofrece la división 50-50 de estadísticas y R que quería el OP, así que no me molesté en mencionarlo. Sin embargo, todavía soy un novato en las estadísticas, así que toma mis grabaciones con un grano de sal.
Christopher Aden el
1
Hola julie. Sería bueno si puede proporcionar una cita completa para cada libro en su respuesta. :)
cardenal
1

Un buen libro se produce a través de la Universidad de Adelaida, está disponible de forma gratuita en línea y como una compra impresa.

Estadísticas de aprendizaje con R

Está muy bien dividido en su estructura y cubre una introducción a R, así como una introducción básica a las estadísticas antes de pasar a temas más detallados.

Hay una lista muy profunda de libros en el sitio web de R que lo proporciona como referencia, sin embargo, actualmente no he leído los títulos, se actualizará a medida que avance.

https://www.r-project.org/doc/bib/R-books.html

dice
fuente
0

Learning Statistics Using R de Randall E. Schumacker saldrá en enero de 2014 de SAGE Publications. Contiene todo el material en la publicación.

Cachondo
fuente
3
Está bien que la gente nos haga saber sobre su propio trabajo. Apreciamos profundamente tener ese tipo de conocimiento de primera mano. Sin embargo, es más que una buena idea reconocer la conexión de uno con cualquier recomendación: le da a la recomendación más credibilidad y también le brinda el crédito que se merece :-). Quizás podría aprovechar esta oportunidad, Randy, para ampliar su respuesta, reconocer su autoría y decir más acerca de por qué su libro sería una gran opción para los fines establecidos en la pregunta. Y bienvenido a nuestro sitio!
whuber