En cierto sentido, esta es una publicación cruzada mía de math.stackexchange , y tengo la sensación de que este sitio podría proporcionar una amplia audiencia.
Estoy buscando una introducción matemática al aprendizaje automático. Particularmente, mucha literatura que se puede encontrar es relativamente imprecisa y se gastan muchas páginas sin ningún contenido.
Sin embargo, a partir de dicha literatura, descubrí los cursos de Coursera de Andrew Ng, el libro de Bishop sobre reconocimiento de patrones y finalmente un libro de Smola. Desafortunadamente, el libro de Smola solo está en borrador. En el libro de Smola, incluso se pueden encontrar pruebas, lo que me atrae. El libro de Bishop ya es bastante bueno, pero falta una cierta cantidad de rigor.
En resumen: estoy buscando un libro como el de Smola, es decir, lo más preciso y riguroso posible y utiliza antecedentes matemáticos (aunque las presentaciones breves son, por supuesto, correctas).
¿Alguna recomendación?
fuente
Respuestas:
Por lo que describe, le recomiendo "Fundamentos del aprendizaje automático" de Mohri et.al. Es un texto de pregrado, pero es para muy buenos estudiantes de pregrado. Es legible y es el único lugar donde he encontrado lo que llamaría una definición matemática de aprendizaje automático (pac y pac débil). Vale la pena leer solo por esa razón. También tengo un doctorado en matemáticas. Conozco y me gustan muchos de los libros mencionados anteriormente. Soy particularmente aficionado a ESL por un amplio espectro de técnicas e ideas, pero es un libro de estadísticas con muchas matemáticas.
fuente
Recomendaría Elementos de aprendizaje estadístico (archivo PDF gratuito). Tiene suficientes matemáticas y una buena introducción a todas las técnicas relevantes, junto con algunas ideas sobre por qué funcionan las técnicas (y cuándo no).
También Introducción al aprendizaje estadístico (que es más práctico: cómo hacerlo en R ). Tiene un curso de aprendizaje estadístico ; Puede encontrar las conferencias en YouTube (y nuevamente en PDF gratuito).
fuente
Probablemente te gustará Learning With Kernels de Schölkopf y Smola. La mayor parte del trabajo de Schölkopf es matemáticamente riguroso.
Dicho esto, probablemente sea mejor leer trabajos de investigación en lugar de libros de texto. Los trabajos de investigación contienen derivaciones completas y pruebas de convergencia, límites en el rendimiento, etc. que a menudo no se incluyen en los libros de texto. Un buen lugar para comenzar es el Journal of Machine Learning , que es muy apreciado y tiene un acceso totalmente abierto. También recomiendo las actas de conferencias como ICML , NIPS , COLT e IJCNN .
fuente
Sugeriría Comprensión del aprendizaje automático: de la teoría a los algoritmos por Shai Shalev-Shwartz. Admito que leí solo pequeñas porciones, pero inmediatamente noté el rigor con el que el autor abordaba cada problema y discusión.
fuente