He estado tratando de entender el aprendizaje por refuerzo durante bastante tiempo, pero de alguna manera no puedo visualizar cómo escribir un programa para el aprendizaje por refuerzo para resolver un problema mundial de la red. ¿Me puede sugerir algunos libros de texto que me ayuden a construir una concepción clara del aprendizaje por refuerzo?
9
Respuestas:
Aquí tienes algunas buenas referencias sobre el aprendizaje por refuerzo:
Clásico
Sutton RS, Barto AG. Aprendizaje de refuerzo: una introducción. Cambridge, Mass: A Bradford Book; 1998. 322 p.
El borrador para la segunda edición está disponible de forma gratuita: http://incompleteideas.net/book/the-book-2nd.html
Russell / Norvig Capítulo 21:
Russell SJ, Norvig P, Davis E. Inteligencia artificial: un enfoque moderno. Upper Saddle River, Nueva Jersey: Prentice Hall; 2010
Más técnico
Szepesvári C. Algoritmos para el aprendizaje por refuerzo. Conferencias de síntesis sobre inteligencia artificial y aprendizaje automático. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Programación dinámica y control óptimo. 4ta edición. Belmont, Mass .: Athena Scientific; 2007. 1270 p. Capítulo 6, vol 2 está disponible de forma gratuita: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Para desarrollos más recientes
Wiering M, van Otterlo M, editores. Aprendizaje reforzado. Berlín, Heidelberg: Springer Berlin Heidelberg; 2012 Disponible en: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Toma de decisiones bajo incertidumbre: teoría y aplicación. 1 edición Cambridge, Massachusetts: The MIT Press; 2015. 352 p.
Aprendizaje de refuerzo multiagente
Buşoniu L, Babuška R, Schutter BD. Aprendizaje de refuerzo de múltiples agentes: una descripción general. En: Srinivasan D, Jain LC, editores. Innovaciones en sistemas y aplicaciones de múltiples agentes - 1. Springer Berlin Heidelberg; 2010 p. 183–221. Disponible en: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Aprendizaje automático de múltiples agentes: un enfoque de refuerzo. Hoboken, Nueva Jersey: Wiley; 2014.
Videos / Cursos
También sugeriría el curso de David Silver en YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
fuente
Hay un curso gratuito en línea sobre el aprendizaje por refuerzo de Udacity. Comprobar: Aprendizaje automático: Aprendizaje por refuerzo
fuente
Realmente disfruté el refuerzo de aprendizaje: una introducción de Richard Sutton. Proporciona una vista unificadora muy agradable sobre RL, aunque no menciona los enfoques más recientes (es de 1998).
fuente
Puede consultar mi libro: Aprendizaje práctico de refuerzo con Python que explica el aprendizaje de refuerzo desde cero hasta los algoritmos avanzados de aprendizaje de refuerzo avanzado de última generación.
Todo el código junto con la explicación ya está disponible en mi repositorio de github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python
fuente