Preguntas etiquetadas con combinatorial-games

20

¿Cómo manejar movimientos inválidos en el aprendizaje por refuerzo?

Quiero crear una IA que pueda jugar cinco en raya / gomoku. Como mencioné en el título, quiero usar el aprendizaje de refuerzo para esto. Utilizo el método de gradiente de políticas , a saber, REINFORCE, con línea de base. Para el valor y la aproximación de la función política, utilizo una red...

9

Algunas dudas sobre la aplicación del aprendizaje por refuerzo a juegos como el ajedrez

Inventé un juego de tablero similar al ajedrez. Construí un motor para que pueda jugar de forma autónoma. El motor es básicamente un árbol de decisión. Está compuesto por: Una función de búsqueda que en cada nodo encuentra todos los movimientos legales posibles Una función de evaluación que...

reinforcement-learning game-ai game-theory combinatorial-games negamax

9

¿Redes neuronales vs algoritmos genéticos en juegos como Tic Tac Toe?

Actualmente estoy haciendo un proyecto que consiste en crear una IA para jugar al juego Gomoku (es como un tic tac toe, pero se juega en un tablero de 15 * 15 y requiere 5 seguidos para ganar). Ya he implementado con éxito una IA de tic tac toe perfecta usando Q learning y teniendo estados /...

neural-networks machine-learning genetic-algorithms combinatorial-games