PBE tómalo o déjalo

9

He encontrado una pregunta interesante mirando el perfecto equilibrio bayesiano. No he visto una pregunta donde las creencias no son discretas.

Hay un único comprador potencial de un objeto que tiene valor cero para el vendedor. La valoración v de este comprador se distribuye uniformemente en [0, 1] y es información privada. El vendedor nombra un precio que el comprador acepta o rechaza.p1

Si acepta, el objeto se negocia al precio acordado y la recompensa del comprador es y la del vendedor es .p 1vp1p1

Si rechaza, el vendedor hace otra oferta de precio, p2. Si el comprador acepta esto, su recompensa es y la del vendedor es , donde .δ p 2 δ = 0.5δ(vp2)δp2δ=0.5

Si rechaza, ambos jugadores obtienen cero (no hay más ofertas).

Encuentre un equilibrio bayesiano perfecto.

Mi enfoque habitual es fijar creencias, pero no sé cómo hacer esto con creencias continuas. ¿Algún consejo?

Brian
fuente
Lo siento, no se me ocurrió una manera fácil de dar consejos parciales. Este es un buen ejercicio. ¿Le importaría (o al creador) si lo usara en clase?
Giskard
¡Por supuesto, siéntete libre!
Brian

Respuestas:

6

Después de publicar una mala solución ayer, creo que obtuve una mejor:

La estrategia del comprador consta de dos funciones, donde ambas funciones se asignan a { A , R } (donde A significa Aceptar, R para rechazar). La estrategia del vendedor es ( p 1 , p 2 ( f 1 ( v , p 1 ) )(f1(v,p1),f2(v,p1,p2)){A,R}AR(p1,p2(f1(v,p1)))f2(v,p1,p2)Avp2Hp1p 1 v - p 1δ ( v - p 2 ) . v (

p2=argmaxp2p2Prob(f2(v,p1,p2)=A|f1(v,p1)=R).
p1
vp1δ(vp2).
v(1δ)p1δp2.
El lado izquierdo de esta ecuación está aumentando en , por lo que los tipos con alta valoración aceptarán. Esto significa que en PBE el conjunto es tal que De esto obtenemos el óptimo dado : En PBE es una función de : entonces Hemos determinado todas las estrategias de PBE perovH
H=[0,v¯).
p2v¯
p2=argmaxp2p2Prob(vp2|v[0,v¯))=v¯2.
v¯p1
v¯(1δ)=p1δv¯2,
v¯=p11δ2.
p1 . La recompensa esperada del vendedor es donde Sustituyendo esto obtenemos
p1(1p1δp2(v¯(p1))1δ)+12p2(v¯(p1))(p1δp2(v¯(p1))1δp2(v¯(p1))),
p2(v¯(p1))=v¯(p1)2=p11δ22=p12δ.
p1(1p1δp12δ1δ)+12p12δ(p1δp12δ1δp12δ),

Tienes que maximizar este wrt . Con obtuve p1δ=0.5

p1=920,v¯=35,p2=310.
Giskard
fuente
Siento que esta pregunta también se puede interpretar como una empresa que intenta evaluar a los consumidores de diferentes valoraciones representadas como el intervalo de la unidad cerrada. El esquema de fijación de precios óptimo es establecer dos precios para que los clientes de valoraciones altas paguen a un precio más alto en la primera etapa, y algunos de las valoraciones bajas pagarán a un precio más bajo en la segunda etapa.
Metta World Peace
Debe explicar por qué las utilidades son diferentes en la ronda 2. Para el vendedor, podría ser un simple descuento, ¿pero para el comprador? Si el bien fuera duradero, los tipos que lo compren recibirían algunos beneficios en ambas rondas.
Giskard
1
No entiendo del todo. ¿Por qué los compradores no pueden descontar la utilidad derivada en la segunda ronda? Esto puede interpretarse como un descremado de precios de dos períodos, ¿verdad?
Metta World Peace
Vergonzoso, pero nunca he oído hablar de este modelo hasta ahora. Tienes razón, esto describe muy bien el juego anterior.
Giskard
Usted dijo que el comprador aceptará si y solo si pero ¿no rechazará el comprador si tanto como son mayores que , independientemente de si se satisface la desigualdad anterior? v - p 1δ ( v - p 2 ) p 1 p 2 vp1
vp1δ(vp2)
p1p2v
Franklin Pezzuti Dyer