¿Qué libros brindan una visión general de las estadísticas computacionales que se aplican a la informática?

15

Como ingeniero de software, estoy interesado en temas como algoritmos estadísticos, minería de datos, aprendizaje automático, redes bayesianas, algoritmos de clasificación, redes neuronales, cadenas de Markov, métodos de Monte Carlo y generación de números aleatorios.

Personalmente, no he tenido el placer de trabajar de manera práctica con ninguna de estas técnicas, pero he tenido que trabajar con software que, bajo el capó, las empleó y me gustaría saber más sobre ellas, a un alto nivel. Estoy buscando libros que abarquen una gran amplitud; en este punto no es necesaria una gran profundidad. Creo que puedo aprender mucho sobre el desarrollo de software si puedo entender los fundamentos matemáticos detrás de los algoritmos y las técnicas que se emplean.

¿Puede la comunidad de análisis estadístico recomendar libros que pueda usar para obtener más información sobre la implementación de diversos elementos estadísticos en el software?

Thomas Owens
fuente

Respuestas:

3

Es posible que desee leer la pregunta extremadamente popular sobre Stack Overflow sobre qué estadísticas debe saber un programador o un informático .

Jeromy Anglim
fuente
Buena llamada. Uso SO y no sabía que esa pregunta existía. Es bueno tener una reticulación para los momentos en que las preguntas pueden aparecer en múltiples intercambios.
Thomas Owens
3

Aquí hay un muy buen libro de James E. Gentle, Computational Statistics (Springer, 2009), que cubre aspectos tanto computacionales como estadísticos del análisis de datos. Gentle también es autor de otros grandes libros, consulte sus publicaciones.

Otro gran libro es el Manual de estadísticas computacionales , de Gentle et al. (Springer, 2004); está circulando como PDF en algún lugar de la web, así que intente mirarlo en Google.

chl
fuente
1

Recogí una copia de Probabilidad y estadística para informáticos - Michael Baron a la venta con otro libro de estadísticas (lo compré honestamente por su nombre - quería un libro que analizara las estadísticas desde una perspectiva informática, incluso si no fuera perfecto). Todavía no he tenido la oportunidad de leerlo ni resolver ningún problema, pero parece un libro sólido.

El prefacio del libro dice que es para estudiantes de pregrado de nivel superior y estudiantes de posgrado principiantes, y estoy de acuerdo con esto. Se necesita cierta comprensión de la probabilidad y las estadísticas para comprender el contenido de este libro.

Los temas incluyen probabilidad, variables aleatorias discretas, distribuciones continuas, métodos de Monte Carlo, procesos estocásticos, sistemas de colas, inferencia estadística y regresión.

Thomas Owens
fuente
1

Aunque no se trata específicamente de estadísticas computacionales, Un manual de análisis estadísticos con R - Brian S. Everitt y Torsten Hothorn cubre muchos temas que he visto cubiertos en libros de estadísticas básicas e intermedias: inferencia, ANOVA, regresión lineal, regresión logística, estimación de densidad, particionamiento recursivo, análisis de componentes principales y análisis de conglomerados, utilizando el lenguaje R. Esto podría ser de interés para aquellos interesados ​​en la programación.

Sin embargo, a diferencia de otros libros, el énfasis está en usar el lenguaje R para llevar a cabo estas funciones estadísticas. Otros libros que he visto usan combinaciones de álgebra y cálculo para demostrar estadísticas. Este libro realmente se enfoca en cómo analizar datos usando el lenguaje R. Y para hacerlo aún más útil, los conjuntos de datos que usan los autores están en CRAN: el Repositorio R.

Thomas Owens
fuente
1

Computación estadística con R: Maria L. Rizzo cubre muchos de los temas de Probabilidad y estadística para informáticos: probabilidad básica y estadística, variables aleatorias, estadística bayesiana, cadenas de Markov, visualización de datos multivariados, métodos de Monte Carlo, pruebas de permutación, probabilidad estimación de densidad y métodos numéricos.

Las ecuaciones y fórmulas utilizadas se presentan tanto como fórmulas matemáticas como en código R. Diría que un conocimiento básico de probabilidad, estadística, cálculo y tal vez matemáticas discretas sería aconsejable para cualquiera que quiera leer este libro. Un fondo de programación también sería útil, pero hay algunas referencias para el lenguaje R, los operadores y la sintaxis.

Thomas Owens
fuente
1

Como ingeniero informático que viene al análisis de datos yo mismo, un libro realmente legible que cubre las cosas desde una perspectiva bastante ininteligible y legible (a costa de no cubrir tanto como cualquiera de los otros libros sugeridos aquí) fue Programming Collective Intelligence de Toby Segaran. Lo encontré mucho más accesible que, por ejemplo, el libro de Bishop, que es una gran referencia pero se profundiza más de lo que probablemente desee en un primer paso. En amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

usuario1076
fuente
1

CRAN tiene varios buenos ejemplos de libros relacionados con la programación estadística. Algunos de ellos no pertenecen al aprendizaje automático y MCMC, pero cada entrada está anotada, por lo que debe tener una idea aproximada de lo que contiene cada libro para profundizar un poco más. http://www.r-project.org/doc/bib/R-books.html

Christopher Aden
fuente