Estoy muy interesado en el potencial del análisis estadístico para la simulación / pronóstico / estimación de funciones, etc.
Sin embargo, no sé mucho al respecto y mi conocimiento matemático aún es bastante limitado: soy un estudiante de pregrado en ingeniería de software.
Estoy buscando un libro que me ayude a comenzar con ciertas cosas sobre las que sigo leyendo: regresión lineal y otros tipos de regresión, métodos bayesianos, métodos monte carlo, aprendizaje automático, etc. También quiero comenzar con R, así que si había un libro que combinaba ambos, eso sería genial.
Preferiblemente, me gustaría que el libro explicara las cosas conceptualmente y no con demasiados detalles técnicos; me gustaría que las estadísticas fueran muy intuitivas para mí, porque entiendo que hay muchas trampas riesgosas en las estadísticas.
Por supuesto, estoy dispuesto a leer más libros para mejorar mi comprensión de los temas que considero valiosos.
fuente
Para una combinación de R con muchos de los métodos que describe, además del texto de Maindonald y Braun mencionado por @Jeromy Anglim, le sugiero que eche un vistazo a estos dos libros de Julian Faraway:
Ambos tienen introducciones razonablemente simples a los diversos temas, el último cubre una amplia gama de enfoques más modernos para la regresión, incluidas muchas técnicas de aprendizaje automático, pero lo hace a un ritmo más rápido con menos descripción, y ambos ejemplifican las técnicas a través del código R.
Puede obtener un código de la sección de libros del sitio web de R para obtener un 20% de descuento en el PVP si compra directamente en Chapman & Hall / CRC Press, pero compruebe el precio de Amazon o similar para su región, ya que a menudo la reducción en Amazon es competitiva con el precio del editor después del descuento.
Una de las cosas buenas de este par de libros es que le brindan un buen sabor de los métodos modernos con suficiente detalle para luego explorar las áreas que desea con más detalle con textos más especializados.
Parte del contenido que se incluyó en esos libros está disponible en un PDF en línea de Julian, a través de la sección de Documentos Contribuidos del sitio web de R. Le recomiendo que explore esa sección para ver si hay otros documentos que podrían ayudarlo a comenzar sin tener que desembolsar dinero en efectivo. En esta sección también se puede encontrar una versión anterior del texto que se convirtió en la primera edición del texto de Maindonald y Braun.
fuente
Bueno, si quieres una visión general de la mayoría de los métodos estadísticos, y el código R para ellos, no se puede ir muy mal con Venables y Estadística Aplicada Moderno de Ripley en S .
Es sucinto, lúcido y tiene suficiente código R para comenzar con casi cualquier tema estadístico que le interese nombrar.
Compré este libro y desconfiaba del precio frente al recuento de páginas, pero valió la pena la inversión. Asumen cálculo y álgebra lineal, pero dado que usted es ingeniero, eso no debería ser un gran problema.
Su programación S también es maravillosa, pero probablemente no sea lo que estás buscando en este momento.
fuente
Los elementos del aprendizaje estadístico pueden ser poco intimidantes para los principiantes. Recomendaría leer " Introducción al aprendizaje estadístico con aplicaciones en R ", que se puede descargar de forma gratuita desde aquí -> http://www-bcf.usc.edu/~gareth/ISL/ También se han resuelto ejemplos en R Al final de cada capítulo.
" Aprendizaje automático: una perspectiva algorítmica " de Stephen Marsland también cubre una gama más amplia de temas sin entrar demasiado en matemáticas.
fuente
Las respuestas anteriores tienen mucho en el lado de la aplicación de las cosas. En cuanto al material conceptual y al buen pensamiento estadístico, recomendaría la Teoría de la probabilidad: la lógica de la ciencia por Edwin Jaynes. Los primeros tres capítulos están disponibles de forma gratuita aquí.
Sin embargo, no tiene una gran cantidad de programas informáticos, por lo que el lado de la aplicación está en los problemas más estilizados. Tiene un capítulo brillante sobre paradojas de la teoría de la probabilidad, con una excepción, la "paradoja de la marginación", que se resuelve correctamente aquí (aunque Jaynes esencialmente "aprende la lección" en el sentido de que un prior inapropiado debería ser el límite de una secuencia de previos apropiados) .
fuente
Las sugerencias hechas hasta ahora son excelentes, pero se centran en las técnicas más avanzadas y sofisticadas que utilizan el software R. Para una visión general excelente e intuitiva de las técnicas multivariadas clásicas, el marco subyacente para los enfoques más actualizados, que incluyen regresión, ANOVA, análisis factorial, análisis de conglomerados, análisis discriminante, análisis de tablas de contingencia y análisis de ecuaciones estructurales, Multivariado de Dillon y Goldstein Las estadísticas publicadas por Wiley en los años 80 siguen siendo un clásico. Es lúcido y se aplica en sus ejemplos sin ser demasiado teórico o vinculado al software.
Dillon and Goldstein es el libro que recomendaría a cualquiera que quiera comprender dónde se originaron los métodos modernos de aprendizaje automático.
fuente
Recomendaría "Análisis de series temporales y sus aplicaciones con ejemplos R" de Shumway y Stoffer
La tercera edición: http://www.stat.pitt.edu/stoffer/tsa3/
Haga clic y compre http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
fuente
El R Cookbook es una excelente manera de saltar a R y comenzar a aprender a usarlo. Es muy práctico, por lo que es excelente para aprender a usar el lenguaje, pero también debes buscar un buen libro de teoría.
fuente