¿Cuáles son los prerrequisitos matemáticos para comprender la parte central de los algoritmos en inteligencia artificial y desarrollar un algoritmo propio?
Por favor, remítame los libros específicos.
fuente
¿Cuáles son los prerrequisitos matemáticos para comprender la parte central de los algoritmos en inteligencia artificial y desarrollar un algoritmo propio?
Por favor, remítame los libros específicos.
Fundación buena matemática
Comience por garantizar la plena competencia con álgebra intermedia y algunos otros fundamentos de cálculo y matemáticas discretas, incluida la terminología y los conceptos básicos dentro de estos temas.
Fundamentos de la cibernética
Norbert Wiener, Cybernetics, 1948, MIT Press, contiene series de tiempo y conceptos de retroalimentación con una claridad y un comando que no se ven en trabajos posteriores; también contiene una introducción a la teoría de la información que comienza con la fórmula log 2 de Shannon para definir la cantidad de información en un bit. Esto es importante para comprender la expansión del concepto de entropía de la información.
Cálculo
Encuentre un buen libro de cálculo y asegúrese de tener claridad sobre la teoría clave y la aplicación en estas categorías.
Gran parte de eso está en Calculus , Strang, MIT, Wellesley-Cambridge Press . Aunque el PDF está disponible en la web, es básico y no particularmente profundo. El que está en la biblioteca de nuestro laboratorio es Cálculo intermedio , Hurley, Holt Rinehart y Winston, 1980 . Es completo y, en algunos aspectos, está mejor diseñado que el que tengo en la biblioteca de mi casa, que Princeton usa para estudiantes de segundo año.
Asegúrese de estar cómodo trabajando en espacios más allá de ℝ 2 (más allá de 2D). Por ejemplo, los RNN a menudo se encuentran en espacios como ℝ 4 hasta ℝ 7 debido a las dimensiones horizontal, vertical, profundidad de píxeles y fotogramas de la película.
Matemáticas finitas
Es lamentable que ninguna combinación de ninguno de los tres libros que se me ocurra tenga todos estos.
Quimica y Neurologia
Es bueno recordar los equilibrios químicos de la química de la escuela secundaria. Balance juega un papel clave en diseños de IA más sofisticados. Comprender la relación simbiótica entre modelos generativos y discriminativos en las GAN ayudará a un alumno a profundizar esta comprensión.
Las funciones de control dentro de los sistemas biológicos siguen siendo una fuente primaria de pruebas de concepto en la investigación de inteligencia artificial. A medida que los investigadores se vuelven más creativos al imaginar formas de adaptación que no imitan directamente algún aspecto de la biología (aún a cierta distancia de este escrito), la creatividad puede jugar un papel más importante en la formulación de objetivos de investigación de IA.
Aun así, la IA probablemente seguirá siendo un campo en gran medida interdisciplinario.
Trabajo como profesor, y recientemente diseñé los requisitos de matemáticas para una nueva especialización en IA, en consulta con muchos de mis colegas en otras instituciones.
Las otras respuestas, particularmente @ FauChrisian, hacen un buen trabajo al catalogar todos los temas específicos que podrían ser útiles en algún lugar de la IA, pero no todos son igualmente útiles para comprender los temas centrales. En otros casos, comprender el tema es esencialmente lo mismo que comprender los algoritmos de IA relacionados, por lo que generalmente solo los enseñamos juntos en lugar de asumir el requisito previo de conocimiento. Por ejemplo, los procesos de decisión de Markov no son difíciles de enseñar a alguien que ya conoce los conceptos básicos de la teoría de gráficos y las probabilidades, por lo que generalmente solo los cubrimos cuando enseñamos el aprendizaje de refuerzo en un curso de IA, en lugar de como un tema separado en matemáticas curso.
Los requisitos matemáticos que decidimos son:
Un curso de uno o dos semestres en matemáticas discretas. Esto es tanto para establecer comodidad con pruebas y rigor matemático como con cualquier tema específico en el área. Se trata principalmente de conocimiento "fundamental", pero algunas partes resultan ser muy útiles. La comodidad con las sumas infinitas, los conceptos básicos de los gráficos, la combinatoria y el análisis asintótico son quizás las partes más directamente aplicables. Me gusta el libro de Susanna Epp .
Un curso de uno o dos semestres en álgebra lineal, que es útil en una amplia variedad de temas en IA, especialmente el aprendizaje automático y la minería de datos. Lay & Lay es un buen libro, pero probablemente no sea el mejor. Shilov es una recomendación de Ian Goodfellow y otros, pero no lo he intentado yo mismo.
Un curso de probabilidad, y posiblemente un curso moderno de estadística (es decir, con un enfoque bayesiano). Sin embargo, un curso anterior de estadística, o uno dirigido a científicos sociales, no es muy útil. Mis colegas estadísticos están usando Lock5 en este momento y tienen buenas experiencias con él.
Al menos cálculo diferencial e integral, y preferiblemente al menos derivadas parciales en cálculo vectorial, pero tal vez todo el curso. Esto es útil en la optimización, el aprendizaje automático y los enfoques económicos de la IA. Stewart es el libro de texto más común. Es completo y puede usarse para los tres cursos, pero sus explicaciones no siempre son las mejores. Sin embargo, aún lo recomendaría.
Esos son los temas centrales. Si no lo hace también tiene un fondo tradicional en la programación, a continuación, un curso de teoría de grafos y los fundamentos de la complejidad asintótica o el diseño de algoritmos y análisis podrían ser buenos suplementos. Por lo general, los AI provienen de un entorno estándar de informática, que cubre todas esas cosas muy bien.
fuente
En lo que respecta a algoritmos simples como Gradient Descent, debe tener una buena comprensión de las derivadas parciales. Especialmente si quieres implementar redes neuronales. Además, la mayoría de los algoritmos están vectorizados para mejorar la velocidad informática y, por lo tanto, debe sentirse cómodo con las matemáticas de matriz. Esto implica ser realmente rápido y cómodo con las dimensiones de matrices, dimensiones de productos, multiplicación de matrices, transposición, etc. Muy raramente, puede usar el cálculo matricial para llegar directamente a soluciones óptimas, por lo que algunos resultados de esta área deberían servir. Continuando, necesita comprender algunos análisis de funciones. esto es necesario para tener una idea de qué funciones de activación están haciendo sigmoid y tanh, log. Una comprensión de la probabilidad y las expectativas también es realmente útil. También debe ser claro con los vectores ortogonales y los productos internos.
Dicho esto, te sugiero que comprendas las operaciones básicas de cálculo y matriz e intentes aprender conceptos de IA. Si no puede resolver algo, explore las matemáticas.
Nota: nuevamente esto es solo para comenzar.
fuente