Preguntas etiquetadas con reinforcement-learning

Un conjunto de estrategias dinámicas mediante las cuales un algoritmo puede aprender la estructura de un entorno en línea tomando acciones adaptativas asociadas con diferentes recompensas para maximizar las recompensas obtenidas.

30
Aprendizaje supervisado, aprendizaje no supervisado y aprendizaje de refuerzo: conceptos básicos del flujo de trabajo

Aprendizaje supervisado 1) Un humano construye un clasificador basado en entrada y salida de datos 2) Ese clasificador está entrenado con un conjunto de datos de entrenamiento 3) Ese clasificador se prueba con un conjunto de datos de prueba 4) Despliegue si el resultado es satisfactorio Para...

19
Cuándo elegir SARSA vs. Q Learning

SARSA y Q Learning son algoritmos de aprendizaje de refuerzo que funcionan de manera similar. La diferencia más notable es que SARSA está en la política, mientras que Q Learning está fuera de la política. Las reglas de actualización son las siguientes: Q

14
GAM vs LOESS vs splines

Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method...