Una recompensa racional factible que no es una recompensa de equilibrio en el juego repetido

5

El libro de texto que estoy leyendo actualmente afirma que, en un juego repetido infinitamente con descuento, podría haber un vector de pago que sea factible e individualmente racional, pero no es un vector de pago de equilibrio en el juego repetido. El ejemplo es el siguiente juego básico para tres jugadores:

     L       R
T  0,2,5    0,0,0
M  0,1,0    2,0,5
B  1,1,0    1,1,0

El tercer jugador es un jugador ficticio con una sola acción posible.

En este juego:

  • Los valores mínimos de los jugadores son 1,1,0.
  • El vector de pago 1,1,5 es tanto individualmente racional como factible (por ejemplo, mezclando TL y MR con frecuencias iguales).

¡El libro afirma que el único vector de pago en equilibrio es 1,1,0! ¿Por qué?

Sea un equilibrio en el juego repetido. Los pagos de los jugadores de fila y columna en E deben ser 1, porque:EE

  • Deben ser al menos 1 porque estos son los valores mínimos;
  • Deben ser como máximo 1 porque la suma de las utilidades de estos jugadores en cada resultado es como máximo 2.

En las celdas TR y ML, la suma de utilidades de los jugadores de fila y columna es menor que 2; por lo tanto, estas células no se juegan en equilibrio en absoluto.

Entonces, en equilibrio, las únicas células que se pueden jugar con frecuencia positiva son: TL, MR, BL, BR.

Ahora, los autores afirman que TL y MR tampoco se juegan en absoluto en equilibrio. De esto concluyen que la recompensa del jugador ficticio es 0. No entendí esta parte. ¿Es cierto que TL y MR nunca se juegan en equilibrio? ¿Por qué?

Erel Segal-Halevi
fuente

Respuestas:

5

δ=11,1,5δ<1

U1=0+2δ+0δ2+2δ3+...
U1=1+1δ+1δ2+1δ3+...
U1
Giskard
fuente
Esto es mucho más claro que la explicación en el libro. ¡Gracias!
Erel Segal-Halevi
1
Pero, solo probaste que los jugadores no juegan TL y MR con certeza. También debe demostrarse que no juegan TL y MR con ninguna probabilidad positiva. Creo que la idea es la siguiente: si los jugadores juegan TL con probabilidad positiva, entonces, dado que no juegan TR y ML, esto solo puede suceder si el jugador de la columna juega L con certeza y el jugador de la fila mezcla T y B. Pero, tal mezcla le da al jugador de fila estrictamente menos de 1 en el primer paso. Por lo tanto, el jugador de la fila tiene un incentivo para desviarse a B con probabilidad 1, como usted dijo.
Erel Segal-Halevi