En el aprendizaje por refuerzo, la aproximación de función lineal a menudo se usa cuando hay grandes espacios de estado. (Cuando las tablas de búsqueda se vuelven inviables).
La forma del valor con aproximación de función lineal viene dada por
donde son los pesos y son las características.
Las características están predefinidas por el usuario. Mi pregunta es, ¿cómo se asignan los pesos?
He leído / descargado algunas diapositivas de conferencias sobre learning con aproximación de funciones. La mayoría de ellos tienen diapositivas sobre regresión lineal que siguen. Como son solo diapositivas, tienden a estar incompletas. Me pregunto cuál es la conexión / relación entre los dos temas.