En Una introducción a la teoría de juegos, el equilibrio de Osborne se describe de la siguiente manera (p. 21-22):
Primero, cada jugador elige su acción de acuerdo con el modelo de elección racional, dadas sus creencias sobre las acciones de los otros jugadores. Segundo, la creencia de cada jugador sobre las acciones de los otros jugadores es correcta.
Me parece que esta definición no es completamente equivalente a la definición habitual del equilibrio de Nash como un perfil de estrategia donde la estrategia de cada jugador es la mejor respuesta a las estrategias de los demás.
La definición habitual no dice nada acerca de las creencias y, por lo tanto, permite la posibilidad de que las creencias sean incorrectas.
Para tomar una posibilidad trivial, considere el dilema del prisionero. Supongamos que cada jugador cree que el otro jugador no va a confesar. Dado que confesar es una estrategia dominante, cada jugador aún confesaría. Entonces, las acciones constituyen un equilibrio de Nash a pesar de que las creencias de los jugadores son completamente opuestas a las acciones de equilibrio reales.
¿Estoy en lo cierto al entender que la definición de Osborne caracteriza algo más que el equilibrio de Nash?
fuente
Respuestas:
Introducir el lenguaje de las creencias aquí es un poco extraño, dado que las creencias tienen un significado muy específico en otras partes de la teoría de juegos.
De hecho, la descripción de Osborne recuerda a un equilibrio de Bayes Nash. Podríamos introducir la noción de creencias en la forma normal de un juego de información completa de la siguiente manera: supongamos que con probabilidad cada jugador, i , es un "estratégica" tipo que jugará de acuerdo con el equilibrio (Nash), y con probabilidad 1 - a i seleccionará alguna estrategia uniformemente al azar (porque, por ejemplo, es indiferente en todas las acciones). Por lo tanto, tenemos un juego bayesiano donde pensar sobre creencias es más natural.unyo yo 1 - ayo
El concepto de solución de Bayes Nash dice que la estrategia de debe ser óptima dado el juego esperado inducido por las estrategias de los otros jugadores y las creencias sobre sus tipos implicadas por { a j } j ≠ i . Si consideramos el límite como un i → 1 para todo i, entonces el equilibrio de Bayes Nash de este juego coincidirá con el concepto de solución descrito por Osborne.yo { aj}j ≠ i unyo→ 1 yo
Supongo que la razón por la que Osborne lo escribió así es pedagógica, dado que este es un texto introductorio. Cuando introducimos los estudiantes a juegos estáticos, les decimos que el jugador mejor responde a las acciones de los otros jugadores. Los estudiantes naturalmente quieren saber "¿cómo pueden responder a una estrategia elegida simultáneamente sin saber cuál será esa estrategia?" Esta es, en muchos sentidos, una pregunta filosófica. Las respuestas comunes sonyo
Parece que las predicciones en el segundo punto corresponden a las "creencias" invocadas por Osborne. Sin embargo, es importante enfatizar que estas predicciones / "creencias" son meramente una herramienta informal / intuitiva para ayudarnos a conceptualizar lo que está sucediendo en un equilibrio y no son parte de la definición de tal equilibrio. El concepto del equilibrio de Nash en sí mismo es completamente agnóstico en la noción de creencias (como se observa en un comentario, se define solo sobre las acciones), razón por la cual, cuando Osborne continúa definiendo formalmente el equilibrio de Nash, lo hace sin invocar el idea de creencias en absoluto.
fuente
La introducción de la creencia hace que el concepto de NE sea comparable a otros conceptos de refinamiento como PBE y equilibrio secuencial, pero el significado de NE no cambia.
El micro libro de texto graduado de Mas-Colell, Whinston y Green (MWG) tiene un resultado para esto
Por lo tanto, el ejemplo del Dilema del Prisionero que usted da donde los jugadores tienen creencias opuestas a lo que la estrategia real del oponente falla en la segunda condición, que requiere que las creencias se deriven de la regla de Bayes siempre que sea posible. De hecho, este es el equivalente matemático del segundo requisito de la definición de Osborne: que la creencia de un jugador sobre las acciones de los otros jugadores es correcta.
fuente
El ejemplo de dilema de tu prisionero solo funciona porque es un juego con estrategias dominantes. Osborne está en lo correcto.
Para responder mejor a la estrategia de otro jugador, como en la definición que das, debo conocer su estrategia. En otras palabras, debo tener creencias sobre lo que están haciendo, y esas creencias deben ser correctas. Esto es un fortalecimiento del concepto de racionalización.
fuente
Podría estar repitiendo cosas que se han dicho antes, pero aquí está mi opinión sobre esto.
Creo que enfrentamos un problema habitual al comparar dos modelos diferentes. Lo que significa una "equivalencia" no es completamente obvio porque las dos definiciones se encuentran en mundos diferentes o modelos diferentes. Sin embargo, si la "equivalencia" se define adecuadamente, creo que uno puede entender la definición de Osborne y demostrar que es "equivalente" a un NE.
El concepto de solución subyacente a la sección citada sería algo como lo siguiente:
Esta es la parte difícil. ¿Qué significa que "cada NE es un BE"? Ciertamente no es que "un NE más cualquier perfil de creencias es un BE", como lo demostró el OP con su contraejemplo. Sin embargo, es el caso de que "cualquier NE puede convertirse en un BE para algún perfil de creencias ". Creo que es en este sentido que uno debería entender la afirmación de "equivalencia" de Osborne
Tenga en cuenta que también tenemos la siguiente declaración más "de equivalencia": "Un resultado del juego es un resultado NE si y solo si es un resultado BE".
fuente