La idea es, precisamente, que los jugadores no eligieron acción s , pero sólo eligieron una acción en el momento en cada nodo en el que juegan, en base a sus creencias acerca de la forma en que otros jugadores y ellos mismos van a jugar en futuros nodos en el juego (donde las creencias son condicionales a la historia que condujo a ese nodo).
La interpretación es permitir que los jugadores elijan estrategias completas es equivalente a permitir que los jugadores confíen en un programa de computadora para jugar el juego en su lugar. Es decir, pueden comprometerse a través de este programa de computadora a jugar una acción determinada en cada nodo.
Tales juegos con dispositivos de compromiso son, en esencia, muy diferentes de los juegos en los que los jugadores reales tienen que elegir repetidamente una acción en cada uno de sus nodos de decisión. Cuando los jugadores reales juegan en los nodos, los jugadores tienen que formarse creencias sobre la forma en que otros jugadores y ellos mismos jugarán en los nodos futuros, y estas creencias pueden depender de la historia que condujo a los nodos futuros .
Por ejemplo, en un juego de Stackelberg, el líder podría creer que el seguidor será racional (es decir, maximiza la utilidad) si el líder juega "Baja producción", pero será irracional (es decir, no maximiza la utilidad) si el líder juega "Alto" producción". Tal vez el líder anticipa que el seguidor se enojará si el líder juega "Alta producción", y que, cegado por su enojo, el seguidor entonces quiere tomar represalias.
Si el seguidor podría haberse comprometido a través de una estrategia, el juego habría sido completamente diferente. Quizás el seguidor podría haberse comprometido a no tomar represalias antes de enojarse, y ya no puede evitar su deseo de tomar represalias. Pero aquí la idea es que el seguidor real tiene que elegir una acción más adelante en el juego dado lo que el líder eligió en el nodo raíz. Por lo tanto, la regla de comportamiento a través de la cual el seguidor elige una acción en un nodo (por ejemplo, utilidad máxima versus no utilidad máxima), y las creencias del líder sobre estos procedimientos pueden depender de la historia que condujo a ese nodo también.
Esto abre el camino para muchos resultados nuevos del juego que no habrían surgido de la teoría de juegos clásica. Desde un punto de vista conceptual, también cambia el enfoque de los conceptos de solución a la suposición epistémica y conductual (es decir, de la teoría clásica de juegos a la teoría epistémica de juegos). En lugar de identificar un conjunto de resultados razonables (p. Ej., Resultados de equilibrio de Nash) y observar las estrategias que coinciden con estos resultados, uno identifica propiedades razonables de los comportamientos y creencias de los jugadores (sobre las creencias y comportamientos de los demás) y deriva las conclusiones de estos supuestos epistémicos y de comportamiento para el resultado a medida que se desarrolla el juego .
Ahora, esto es solo para darle algo de carne e intuición al marco de Battigalli, y no le hace justicia a la riqueza del marco (en parte porque no sé mucho sobre su trabajo, aparte del video que vinculaste). Si aún no lo ha hecho, le recomiendo que vea el video completo. Creo que Battigalli hace un gran trabajo al hacer que su marco sea accesible. También presenta ejemplos útiles e intuitivos para conectar su enfoque epistémico a la teoría de juegos "clásica" mediante la identificación de condiciones simples en las creencias y comportamientos de los jugadores que permiten recuperar soluciones clásicas a juegos como la inducción hacia atrás.