¿Puedo refinar el conjunto de equilibrios en un juego de señalización al resultado óptimo para el emisor?

12

Pregunta principal: He estado leyendo mucho sobre juegos de comunicación, y me pregunto si hay buenos criterios para seleccionar entre dos equilibrios de separación. Pienso en un equilibrio de separación como equilibrio de coordinación entre tipos. Entonces, si garantizamos que estos tipos se coordinan con éxito, ¿por qué no concederíamos que se coordinen a un equilibrio óptimo del emisor (en un sentido de Pareto eficiente entre los emisores)? Es decir, supongamos que existe un único equilibrio secuencial en el que todos los emisores obtienen resultados estrictamente mejores que en los equilibrios restantes. ¿Qué argumentos hay para seleccionar este equilibrio?


Considere el siguiente juego de comunicación. Los pagos del receptor son el segundo número en el par. Hay seis tipos de remitentes, con pagos dados como el primer elemento de los pares. Mostraré que hay un equilibrio de agrupación y al menos dos separaciones parciales. Me pregunto qué tipo de técnicas se pueden utilizar para argumentar a favor de un equilibrio de separación. Uno es óptimo para el emisor y el otro es óptimo para el receptor.

ActionBActionLActionRActionLLActionRRtypeB(0,3)(1,2)(1,2)(2,1)(2,1)typeL(0,2)(1,3)(1,2)(2,0)(2,2.25)typeR(0,2)(1,2)(1,3)(2,2,25)(2,0 0)typagmiLL(0 0,1)(1,2)(1,0 0)(2,3)(2,1)typagmiRR(0 0,1)(1,0 0)(1,2)(2,1)(2,3)typagmiH(0 0,0 0)(1,0.9)(1,0.9)(2,3.1)(2,3.1)

Sea su distribución previa en los tipos dondeπ ( B ) = .3 , π ( L ) = π ( R ) = .2 , π ( L L ) = π ( R R ) = .1 , π ( H ) = .1 .π

π(si)=.3,π(L)=π(R)=.2,π(LL)=π(RR)=.1,π(H)=.1.

En un equilibrio de agrupación, el receptor tomará la acción para el pago esperado , superando .E U 2 ( B ) = .3 ( 3 ) + .4 ( 2 ) + .2 ( 1 ) = 1.9 E U 2 ( L ) = .3 ( 2 ) + .2 ( 3 ) + .2 ( 2 ) + .1 ( 2 ) + .1 ( .9 ) = 1.89simiU2(si)=.3(3)+.4(2)+.2(1)=1.9miU2(L)=.3(2)+.2(3)+.2(2)+.1(2)+.1(.9)=1,89

Sin embargo, hay equilibrios que se separan parcialmente.

Separación 1 Deje que los tipos "soliciten" acción , los tipos y "soliciten" y luego y mezclen 50/50 entre las dos señales. Deje que los mensajes sean y con la interpretación natural.L R R R R B H l rL,LLLRRRRsiHlr

EntoncesmiU2(Ll)Pr(l)=.15(2)+.2(3)+.1(2)+.025(1)=1.125=miU2(Rr)Pr(r)

Entonces el receptor gana en expectativa. Los remitentes también están mejor.2,25

Separación 2 Pero consideremos otro tipo de separación. Los tipos y siempre envían un mensaje , "pidiendo" la acción . Los tipos y envían , solicitando la acción . Nuevamente, y aleatorizan uniformemente.RLLllLLLRRrrRRsiH

Entonces,La recompensa esperada es 1.955 porque cada mensaje se recibe la mitad del tiempo.miU2(RRrr)Pr(rr)=.15(1)+.2(2,25)+.1(3)+.025(3.1)=.9775=miU2(LLll)Pr(ll).

Responder a con la acción y con produce una recompensa menor, por lo que la separación, mezclada con la agrupación de tipos y , no es útil para tomar las acciones "correctas" o como le gustaría al receptor.rrRllLLRRLR

Me parece que este último equilibrio es más robusto. Hay dos equilibrios de separación, que requieren coordinación. Concediendo que los remitentes pueden coordinar, ¿por qué no se coordinarían de la manera óptima para el remitente?

Me pregunto si existen métodos que refinen el conjunto de equilibrio para excluir la separación óptima del receptor. Se podría decir que el primer equilibrio de agrupamiento no es a prueba de neologismo.

La prueba de neologismo se define en la sección 3 de este documento. Aproximadamente, no debe haber un mensaje adicional (fuera de ruta) tal que, si se observa, el receptor podría formar creencias y una estrategia racional basada en esas creencias, de modo que todos los que enviaron el mensaje estén estrictamente mejor en relación con el equilibrio propuesto y aquellos quien no prefirió débilmente el resultado de equilibrio propuesto. Supongo que eso no funcionará aquí, porque tienes que considerar dos neologismos ( y ) a la vez para eliminar la separación 1, lo que requiere esencialmente colusión. ¿Pero hay alguna otra idea?llrr

Pburg
fuente
Tengo curiosidad por cómo se calcula el pago del remitente aquí. Parece que es la recompensa ex ante del remitente la que está utilizando para juzgar la óptima. Pero, ¿cuál es la distribución objetiva de los tipos de remitente? ¿Es lo mismo que el receptor anterior?
Herr K.
Sí, ex ante. El objetivo es el mismo que el anterior.
Pburg
¿Está interesado en escuchar sobre argumentos de puntos focales, o está buscando un refinamiento de equilibrio más "estándar"?
Martin Van der Linden
Preferiblemente algo más estándar, pero los puntos focales también serían bienvenidos.
Pburg
2
Una respuesta trivial es que simplemente puede seleccionar el equilibrio óptimo de Pareto. Muchos documentos hacen esto, generalmente con una frase como "centrarse en el equilibrio óptimo del emisor". Una justificación está en Mailath, Okuno-Fujiwara y Postlewaite (1993). Un enfoque más basado en principios es agregar ruido, para que cada mensaje sea enviado por cada tipo con una probabilidad positiva. La probabilidad es cercana a 1 para el mensaje deseado y cercana a 0 para no intencionado. Puede llevar la probabilidad de error a cero y utilizar el equilibrio límite como refinamiento. Estructura de error diferente => equilibrio seleccionado diferente.
Sander Heinsalu