Libro para una visión general y conceptual de los métodos estadísticos.

12

Estoy muy interesado en el potencial del análisis estadístico para la simulación / pronóstico / estimación de funciones, etc.

Sin embargo, no sé mucho al respecto y mi conocimiento matemático aún es bastante limitado: soy un estudiante de pregrado en ingeniería de software.

Estoy buscando un libro que me ayude a comenzar con ciertas cosas sobre las que sigo leyendo: regresión lineal y otros tipos de regresión, métodos bayesianos, métodos monte carlo, aprendizaje automático, etc. También quiero comenzar con R, así que si había un libro que combinaba ambos, eso sería genial.

Preferiblemente, me gustaría que el libro explicara las cosas conceptualmente y no con demasiados detalles técnicos; me gustaría que las estadísticas fueran muy intuitivas para mí, porque entiendo que hay muchas trampas riesgosas en las estadísticas.

Por supuesto, estoy dispuesto a leer más libros para mejorar mi comprensión de los temas que considero valiosos.

Jérôme Le Chatelier
fuente

Respuestas:

11
  • Tal vez le gustaría algo como Análisis de datos y gráficos usando R: un enfoque basado en ejemplos de John Maindonald y W. John Braun

    • Sitio web para libro
    • Amazon con reseñas variadas
    • Lo recomiendo porque el libro cumple con algunos de sus cuadros; enseña un poco de R; proporciona una visión general de una gama de diferentes técnicas de modelado (por ejemplo, regresión múltiple, series de tiempo, gráficos, modelo lineal generalizado, etc.) sin entrar en demasiados detalles matemáticos; Está bastante aplicado.
  • Estoy de acuerdo con @Greg Snow en que es mejor que pienses en leer varios libros diferentes. Para cada tema que mencionó (por ejemplo, estadísticas bayesianas, series de tiempo, simulaciones, R, aprendizaje automático) hay buenos libros dedicados a ese tema en particular. Es posible que desee hacer preguntas por separado sobre lo que sería un buen libro dados sus intereses particulares en ese tema.

  • Buenas opciones en línea disponibles gratuitamente

    • Elements of Statistical Learning es un excelente libro e incluso está disponible en línea de forma gratuita. De tu publicación, tengo la sensación de que podría ser un poco más técnico de lo que quieres al principio, pero échale un vistazo y mira lo que piensas. Tal vez estés listo para eso ahora; quizas mas tarde.
    • Los modelos y datos ecológicos de Benjamin Bolker en R son otros buenos. Es desde una perspectiva ecológica, pero explica la simulación y el ajuste del modelo claramente desde una perspectiva relativamente no técnica; y todo está implementado en R. Puedes ver todo su código R en el sitio web. ¡Incluso puede ver los documentos de Sweave utilizados para generar el libro!
    • Hay una buena lista de documentación gratuita de R sobre CRAN con algunos de los documentos que también proporcionan instrucciones más amplias sobre estadísticas.
Jeromy Anglim
fuente
5

Un solo libro que incluyera todos esos temas sería bastante impresionante y probablemente pesaría más que usted. Es como pedir un solo libro que enseñe programación básica, C, Java, Perl y diseño avanzado de bases de datos, todo en un solo libro (en realidad, probablemente más, pero no conozco suficientes términos de ingeniería de software para agregar algunos más avanzados) .

La regresión en sí misma suele ser al menos un curso universitario completo, las estadísticas bayesianas requieren un curso o 2 de teoría antes de tomar el curso bayesiano para comprenderlo completamente, etc.

No hay un camino rápido y fácil para lo que está tratando de hacer. Sugeriría tomar algunos buenos cursos en su universidad y trabajar desde allí.

Ha habido otras discusiones sobre buenos libros que puede consultar para obtener algunas ideas.

Greg Snow
fuente
Gracias por su respuesta. Sin embargo, no estoy tratando de entender todo sobre todo de un libro, pero leer, digamos, 50 páginas sobre regresión definitivamente me ayudaría mucho para obtener al menos una comprensión razonable de este tema ...
Jérôme Le Chatelier
5

Para una combinación de R con muchos de los métodos que describe, además del texto de Maindonald y Braun mencionado por @Jeromy Anglim, le sugiero que eche un vistazo a estos dos libros de Julian Faraway:

Ambos tienen introducciones razonablemente simples a los diversos temas, el último cubre una amplia gama de enfoques más modernos para la regresión, incluidas muchas técnicas de aprendizaje automático, pero lo hace a un ritmo más rápido con menos descripción, y ambos ejemplifican las técnicas a través del código R.

Puede obtener un código de la sección de libros del sitio web de R para obtener un 20% de descuento en el PVP si compra directamente en Chapman & Hall / CRC Press, pero compruebe el precio de Amazon o similar para su región, ya que a menudo la reducción en Amazon es competitiva con el precio del editor después del descuento.

Una de las cosas buenas de este par de libros es que le brindan un buen sabor de los métodos modernos con suficiente detalle para luego explorar las áreas que desea con más detalle con textos más especializados.

Parte del contenido que se incluyó en esos libros está disponible en un PDF en línea de Julian, a través de la sección de Documentos Contribuidos del sitio web de R. Le recomiendo que explore esa sección para ver si hay otros documentos que podrían ayudarlo a comenzar sin tener que desembolsar dinero en efectivo. En esta sección también se puede encontrar una versión anterior del texto que se convirtió en la primera edición del texto de Maindonald y Braun.

Restablece a Mónica - G. Simpson
fuente
3

Bueno, si quieres una visión general de la mayoría de los métodos estadísticos, y el código R para ellos, no se puede ir muy mal con Venables y Estadística Aplicada Moderno de Ripley en S .

Es sucinto, lúcido y tiene suficiente código R para comenzar con casi cualquier tema estadístico que le interese nombrar.

Compré este libro y desconfiaba del precio frente al recuento de páginas, pero valió la pena la inversión. Asumen cálculo y álgebra lineal, pero dado que usted es ingeniero, eso no debería ser un gran problema.

Su programación S también es maravillosa, pero probablemente no sea lo que estás buscando en este momento.

richiemorrisroe
fuente
2

Los elementos del aprendizaje estadístico pueden ser poco intimidantes para los principiantes. Recomendaría leer " Introducción al aprendizaje estadístico con aplicaciones en R ", que se puede descargar de forma gratuita desde aquí -> http://www-bcf.usc.edu/~gareth/ISL/ También se han resuelto ejemplos en R Al final de cada capítulo.

" Aprendizaje automático: una perspectiva algorítmica " de Stephen Marsland también cubre una gama más amplia de temas sin entrar demasiado en matemáticas.

Siddhesh
fuente
1

Las respuestas anteriores tienen mucho en el lado de la aplicación de las cosas. En cuanto al material conceptual y al buen pensamiento estadístico, recomendaría la Teoría de la probabilidad: la lógica de la ciencia por Edwin Jaynes. Los primeros tres capítulos están disponibles de forma gratuita aquí.

Sin embargo, no tiene una gran cantidad de programas informáticos, por lo que el lado de la aplicación está en los problemas más estilizados. Tiene un capítulo brillante sobre paradojas de la teoría de la probabilidad, con una excepción, la "paradoja de la marginación", que se resuelve correctamente aquí (aunque Jaynes esencialmente "aprende la lección" en el sentido de que un prior inapropiado debería ser el límite de una secuencia de previos apropiados) .

probabilidadislogica
fuente
2
Me encantó este libro, pero no estoy seguro de que sea el lugar para comenzar a tratar de construir una intuición para las estadísticas. Es un texto bastante polémico e idiosincrásico.
Ben Lauderdale
1

Las sugerencias hechas hasta ahora son excelentes, pero se centran en las técnicas más avanzadas y sofisticadas que utilizan el software R. Para una visión general excelente e intuitiva de las técnicas multivariadas clásicas, el marco subyacente para los enfoques más actualizados, que incluyen regresión, ANOVA, análisis factorial, análisis de conglomerados, análisis discriminante, análisis de tablas de contingencia y análisis de ecuaciones estructurales, Multivariado de Dillon y Goldstein Las estadísticas publicadas por Wiley en los años 80 siguen siendo un clásico. Es lúcido y se aplica en sus ejemplos sin ser demasiado teórico o vinculado al software.

Dillon and Goldstein es el libro que recomendaría a cualquiera que quiera comprender dónde se originaron los métodos modernos de aprendizaje automático.

Mike Hunter
fuente
0

El R Cookbook es una excelente manera de saltar a R y comenzar a aprender a usarlo. Es muy práctico, por lo que es excelente para aprender a usar el lenguaje, pero también debes buscar un buen libro de teoría.

Zach
fuente