Supongamos que hay un juego de señalización con un espacio finito mensaje , acción finita espacio , y el espacio tipo finito . Aún más simple, todos los tipos de remitentes tienen preferencias idénticas (el receptor solo prefiere diferentes acciones en respuesta a diferentes tipos). ¿El receptor puede hacerlo estrictamente mejor aleatorizando las respuestas? Cuando existe un equilibrio donde el receptor solo toma acciones puras?
Ubiquitous resumió muy bien mi pregunta: "¿Alguna vez se da el caso de que el equilibrio con las recompensas más altas del receptor implica necesariamente estrategias mixtas?"
Vayamos con el equilibrio secuencial. Si desea comenzar con alguna notación.
es la probabilidad de que envía .
es la probabilidad de que las responde receptor a con da las creencias del receptor después de observar .
Un equilibrio secuencial requiere que dé respuestas óptimas dado , es óptimo dado y es Bayesiano dado . Esta es realmente la definición de un secuencial débil, pero no hay distinción en un juego de señalización.
Mi intuición dice que no cuando existe un equilibrio donde el receptor solo juega acciones puras, pero siempre he sido horrible con este tipo de cosas. Tal vez también tengamos que estipular que no es un juego de suma cero, pero solo lo digo porque recuerdo que los jugadores están mejor con la capacidad de aleatorizar en esos juegos. Tal vez esta es una nota al pie de página en un documento en alguna parte?
Considere el siguiente juego donde las preferencias del remitente no son idénticas. Pido disculpas por la baja calidad. Hay tres tipos de remitentes, cada uno igualmente probable. Podemos crear lo que creo que es el equilibrio óptimo del receptor (jugador 2) solo si se aleatorizan al recibir el mensaje 1. Luego, los tipos 1 y 3 jugarán , creando un equilibrio de separación. Si el receptor usa una estrategia pura en respuesta a m 1 , entonces un tipo 1 o 2 se desviaría y empeoraría el receptor.
fuente
Respuestas:
¡Quizás tenga un contraejemplo!
Que haya tres mensajes, y m 3 , y tres tipos de remitente t 1 , t 2 , t 3 donde Pr ( t = t 3 ) = 1m1,m2, m3 t1,t2,t3 ,Pr(t=t2)=1Pr(t=t3)=12−ϵ yPr(t=t1)=1Pr(t=t2)=14 . Enviarm3da como resultado una recompensa0para los remitentes, podemos pensar que sale del juego.Pr(t=t1)=14+ϵ m3 0
El conjunto de respuestas del receptor a un mensaje es { a , r }m=m1,m2 {a,r}
u R ( t 3 , m i , r ) = 2uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2
Luego, en equilibrio, todos los remitentes deben obtener la misma utilidad, ¿correcto? De lo contrario, uno imitará la estrategia del otro.
Entonces, el único equilibrio de estrategia pura es que todos los remitentes elijan . En un equilibrio de agrupación en o , la mejor respuesta es elegir . No existe una estrategia pura que separe el equilibrio, excepto si y envían , y el receptor responde con . Entonces es indiferente entre todos los mensajes, porque seguramente se encontrará con el pago . Todo esto le da al receptor una recompensam 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3 m1 m2 r t1 t2 m2 r t3 0 32−ϵ
Luego considere el caso donde yAhora, los remitentes son indiferentes entre enviar esos dos mensajes. Luego, deje que y para . Entonces la estrategia del receptor es racional.σ m 2 R ( un ) = 1. σ t 3 ( m 1 ) = ε + 1 / 4σm1R(a)=β σm2R(a)=1. σti(mi)=1i=1,2σt3(m1)=ϵ+1/4−ϵ+1/2=1−σt3(m1) σti(mi)=1 i=1,2
La utilidad esperada del receptor de dado o es 1,5. La utilidad esperada de está ligeramente por encima de 1.5, dado . Por lo tanto, la recompensa esperada ex ante está por encima de , mejor que el equilibrio puro descrito anteriormente. Además, esta separación solo se mantiene mediante la mezcla. Cualquier otra estrategia pura tomada por el receptor inducirá la agrupación del remitente, lo que significa que el único equilibrio de estrategia pura es cuando el receptor elige . a r m 2 a 3m1 a r m2 a r32−ϵ r
Debería tener s en la imagen a continuación para los pagos del remitente del lado izquierdo a . Creo que el es el ingrediente clave.a β < 1β a β<1
fuente
Creo que esto no puede suceder con los remitentes adversos al riesgo, el receptor neutral al riesgo y lo suficientemente rico.A
Por ejemplo, y para apegarse al modelo de señalización canónica, suponga que es la línea real positiva y la utilidad de los remitentes aumenta en mientras que los receptores tienen una utilidad lineal que disminuye enu aA u a .a
(Es cierto que esta es solo una respuesta parcial, ya que el marco es mucho menos general que el de su pregunta, por lo que podría no ser satisfactorio para usted. Todavía proporciono un argumento en caso de que esté de acuerdo con estos supuestos)
Por aversión al riesgo
Bajo algún supuesto de continuidad, también debe existir
tal que
Entonces considere construido de la siguiente maneraσmR′
Los receptores preferirían sobre si no alteraran las señales enviadas por los remitentes, ya que implica compensaciones esperadas más bajas. Pero por construcción, los remitentes son indiferentes entre y , por lo que deben enviar las mismas señales que en . Por lo tanto, no puede ser un equilibrio que muestre que no podemos tener dos acciones diferentes jugadas con probabilidad positiva en un equilibrio. Σ m R σ m RσmR′ σmR Σ m R σ m R σ m RσmR′ σmR σmR σmR
fuente