Soy un ingeniero informático sin experiencia en estadística o matemática avanzada.
Estoy estudiando el libro Python Machine Learning de Raschka y Mirjalili, pero cuando intenté comprender las matemáticas del Machine Learning, no pude entender el gran libro que un amigo me sugirió Los elementos del aprendizaje estadístico .
¿Conoces estadísticas y libros de matemáticas más fáciles para Machine Learning? Si no lo haces, ¿cómo debo moverme?
Respuestas:
Aunque necesita un libro, le recomiendo los siguientes cursos respectivamente para comprender las estadísticas que se utilizan para el aprendizaje automático y otras tareas en ciencia de datos. Son gratis.
Si quiero recomendar un libro, recomendaría el siguiente libro que es gratuito bajo licencia CC . Tiene buenos ejemplos y es muy práctico; Además, hay muchos códigos que te ayudan a sentir estadísticas en ejemplos del mundo real.
Piensa en Python por Allen B. Downey
Manual de Python Data Science
También el siguiente enlace puede ayudar:
fuente
Introducción al álgebra lineal https://math.mit.edu/~gs/linearalgebra/ es un buen punto de partida. Asegúrate de ser bueno con la teoría de la probabilidad, el álgebra lineal y la estadística. Un conocimiento muy profundo puede no ser necesario, pero se requiere tener un buen conocimiento.
fuente
Antes de hacer mi maestría en análisis, mis superiores me sugirieron que revisara estos dos libros para saber más sobre el aprendizaje automático y las estadísticas.
A saber:
Si no puede encontrar estos libros en línea, avíseme si compartirá el enlace, los tengo en mi disco. Estos libros me ayudaron a comprender los conceptos básicos de las estadísticas con ejemplos explicados en términos simples.
Si está buscando algunos cursos en línea, hágamelo saber y le sugeriremos un par de buenos cursos (la mayoría de ellos son gratuitos).
fuente
No puedo decir por su pregunta qué tan experto es en matemáticas o dónde se detiene su aprendizaje. Supongo que, dado que usted es ingeniero informático, está familiarizado con el álgebra, la geometría y tal vez algún cálculo.
Le recomiendo que comience su aprendizaje leyendo estadísticas y entendiendo conceptos como descriptivos, análisis exploratorio de datos, correlación, distribuciones, etc. Veo que prefieres libros en lugar de videos, así que te encontraré a mitad de camino y te proporcionaré algunos libros que están en línea, así como uno o dos libros que puedes comprar impresos.
Primero, recomendaría el currículo de cursos de postgrado en línea de Penn State en estadística . Puede explorar cada uno de sus cursos utilizando el menú de la izquierda. Una vez que seleccione un curso, desplácese hacia abajo en la página web del curso y haga clic en el enlace que dice "notas del curso en línea". Las notas del curso para estos cursos son mucho más que notas y se leen como libros completos. Son muy instructivos. Además, consulte el currículum en línea del curso de pregrado de Penn State en estadísticas , en caso de que encuentre algo en el trabajo de posgrado que sea demasiado avanzado y desee una explicación "más simple".
En segundo lugar, revise el Manual de estadísticas biológicas de John H. McDonald. No dejes que el título te engañe; Este libro es un excelente manual sobre estadísticas y análisis de datos aplicable a cualquier dominio.
Tercero, revise El pequeño manual de estadísticas de Gerard Dallal. De nuevo, no dejes que el título te engañe; Este libro es otra joya que lo guía a través de algunos fundamentos estadísticos importantes.
Cuarto, mira el libro Think Stats de Allen Downey. Hay una versión gratuita en línea de una edición anterior; la edición más reciente que tendrás que comprar. Sin embargo, vale la pena, especialmente si trabajas en Python. En este libro, el autor le enseña estadísticas y análisis de datos utilizando Python para analizar conjuntos de datos del mundo real (juguetes). Este es un libro realmente genial para trabajar.
Por último, echa un vistazo a Data Science from Scratch por Joel Grus. Este libro se centra más en el análisis de datos (en lugar de los fundamentos estadísticos) y pone un mayor énfasis en el aprendizaje automático y el modelado. Utiliza Python (y la pila de ciencia de datos de Python) para guiarlo a través del análisis y la realización de análisis predictivos en conjuntos de datos del mundo real (juguetes). Otro gran libro para trabajar.
fuente
Tenga en cuenta que si bien tengo un Máster en Estadística Aplicada, le daré una respuesta muy simple: tomar un curso sobre probabilidades.
La mayoría de los marcos de programación modernos de ML toman una gran mayoría de las matemáticas de la ciencia de datos; realmente no lo necesitarás en la mayoría de los escenarios. Pero siempre necesitará la capacidad de comprender sus resultados y la mayoría de los resultados se expresan en probabilidades. Si fuera nuevo en ciencia de datos, tomaría un curso (breve) sobre probabilidades, trataría de comprender qué significan realmente las proporciones y porcentajes y luego trabajaría para conocer un marco (como Tensorflow) realmente, muy bien. Si puede hacer eso, puede escribir algunos algoritmos realmente interesantes y no tener que ser obsesivo con las matemáticas.
fuente