Ofertas aleatorias óptimas

7

Esta pregunta proviene de este sitio web que leo con frecuencia.

Dos jugadores van a un nuevo programa de juegos llamado "Mayor número de victorias". Los dos entran en cabinas separadas, y cada uno presiona un botón, y un número aleatorio entre cero y uno aparece en la pantalla. (En este punto, ninguno conoce el número del otro, pero sí saben que los números se eligen de una distribución uniforme estándar). Pueden elegir mantener ese primer número o presionar el botón nuevamente para descartar el primer número y obtener un segundo número aleatorio, que deben guardar. Luego, salen de sus cabinas y ven el número final de cada jugador en la pared. El lujoso gran premio, una caja llena de lingotes de oro, se otorga al jugador que mantuvo el número más alto. ¿Qué número es el límite óptimo para que los jugadores descarten su primer número y elijan otro? Dicho de otra manera, dentro de qué rango deberían elegir mantener el primer número,

Este es un problema de subasta muy extraño con jugadores simétricos (también supongo que los jugadores son neutrales al riesgo) o un juego de lotería / teoría de juegos muy extraño.

¿Cómo abordarías matemáticamente esta pregunta y qué respuesta obtendrías? No hay ningún premio para que obtenga la respuesta correcta al enigma del sitio, solo tengo curiosidad. Mi intuición me dice que el límite óptimo es 0.5, ya que tiene una probabilidad de 50-50 de ser mayor o menor que el número de su oponente, independientemente de si él / ella repite su número aleatorio o no, pero no estoy seguro.

Kitsune Cavalry
fuente
No creo que la neutralidad del riesgo tenga nada que ver con esto, los jugadores simplemente intentan maximizar su probabilidad de ganar. Los pagos son binarios, no hay resultados promedio seguros.
Giskard
@denesp Podría tener aversión al riesgo en el sentido de que si dibujara, digamos 0.46, es posible que no quiera volver a dibujar aunque tenga una mejor oportunidad de obtener un número mejor que uno peor.
Kitsune Cavalry
1
@KitsuneCavalry Entiendo lo que estás diciendo, pero esa sería una noción "conductual" de aversión al riesgo, ya que se define sobre un paso intermedio en lugar de sobre los resultados finales.
Shane
@ Shane Claro, te escucho. Y no estoy demasiado preocupado por eso de todos modos.
Caballería de Kitsune

Respuestas:

6

Primero solo mostraré que el 0.5 (o 12 ) el punto de corte no funciona como un equilibrio simétrico, entonces puedes decidir por ti mismo si quieres pensar en el problema o leer la respuesta completa.

Denotemos los puntos de corte por cx,cy . Supongamos que ambos jugadores usan la estrategia c=12 . Denotemos los números de jugadorxeyrespectivamente porx1ey1y su segundo número potencial porx2ey2. Supongamos queX1=23 . Al mantener esto, la probabilidad de que el jugadorXgane es

PAGS(12y1<23)+PAGS(y1<12)PAGS(y2<23)=16 6+1223=12.
Esto también significa que23 esla mediana de esta distribución.

Ahora supongamos que X1=12 . Al mantener esto, la probabilidad de que el jugadorXgane es

PAGS(y1<12)PAGS(y2<12)=1212=14 4
Pero si descartaraX1=12 tiene probabilidad
PAGS(y1<12)PAGS(X2>y2)+PAGS(y112)PAGS(X2>y1)=38
de ganar. 38>14 4 manteniendo asíX1=12 (y sus alrededores) no es óptimo, por lo tanto no puede ser un movimiento de equilibrio.


ALERTA DE SPOILER

Si el jugador y tiene un límite Cy jugador X dibuja X1=Cy mantiene la probabilidad de que el jugador X gane es

PAGS(y1<Cy)PAGS(y2<Cy)=CyCy=Cy2.
Si el jugadorX dónde descartarX1 la probabilidad de que gane es
PAGS(y1Cy)PAGS(X2>y1)+PAGS(y1<Cy)PAGS(X2>y2)=(1-Cy)(1-1+Cy2)+Cy12
Supongamos que hay un equilibrio simétrico, es decirCX=Cy=C .
(No creo que existan otros equilibrios, pero no lo probé).
Dado que la probabilidad de ganar es continua en el valor deX1 , el valor de corteC es tal que siX1=C entonces la probabilidad de ganar es igual cuandoX1 se mantiene y cuando se descarta. Esto significa que
PAGS(y1<C)PAGS(y2<C)=PAGS(y1C)PAGS(X2>y1)+PAGS(y1<C)PAGS(X2>y2)CC=(1-C)(1-1+C2)+C12C2=12-C+C22+C212C2+C2-12=0 0C=5 5-12.

Giskard
fuente
Alguien hizo una derivación similar a la tuya e hizo este cálculo de Wolfram para verificarlo dos veces : tinyurl.com/j9xey5t Así que voy a seguir adelante y decir que esto parece correcto. Ahora, si resuelve la forma general de este juego, le daré la mejor respuesta: P Kidding ~ (Aunque sería interesante ver cómo cambia el juego con más posibilidades de volver a jugar). ¿Su corte editado significa que ambos jugadores tienen 50 % de victorias, o ¿todavía crees que hay un error en tu respuesta?
Kitsune Cavalry
@KitsuneCavalry Creo que aceptarlo fue un poco prematuro, pero afortunadamente el cálculo es correcto y mi razonamiento sobre el 50% fue incorrecto. El límite es tan alto que el sorteo es 'afortunado' y, por lo tanto, tienes una probabilidad superior al 50% de ganar si lo haces. Antes del sorteo tienes exactamente el 50%.
Giskard
Si cuenta para algo, el sitio que dio la pregunta dio la respuesta. Lo tienes en el dinero. Siéntete como un ganador hoy. Lo ganaste B)
Kitsune Cavalry
2

Supongamos que la persona 1 elige un límite de y la persona 2 elige un límite de c 2 , con c 2c 1 . Sea p 1 ( x ) la probabilidad de que el número final de la persona 1 no sea mayor que x . p 1 ( x ) es igual a c 1 x si x < c 1 y c 1 x + x - c 1 de lo contrario. Definir p 2 (C1C2C2C1pags1(X)Xpags1(X)C1XX<C1C1X+X-C1 manera similar. Ahora trace p 2 ( x ) contra p 1 ( x ) en un diagrama paramétrico para 0 x 1 . El resultado son tres segmentos de línea:pags2(X)pags2(X)pags1(X)0 0X1

  • Uno de a ( c 2 1 , c 1(0 0,0 0) , correspondiente a 0 x c 1 ;(C12,C1C2)0 0XC1
  • Uno de a ( c 1 c 2 + c 2 - c 1 , c 2 2(C12,C1C2)(C1C2+C2-C1,C22)C1XC2
  • Uno de a ( 1 ,(C1C2+C2-C1,C22)(1,1)C2X1

. Para que haya un equilibrio estable, ambas derivadas parciales de este deben ser cero, es decir,1-c2-2c1c212+12(C2-C1)(C1C2+C2-1)

1-C2-2C1C2+C22=0 0-1-C1+2C2-C12+2C1C2=0 0

(C2-C1)(1+C1+C2)=0 0C1=C21-C1-C12=0 0C1=C2=5 5-12

F''
fuente
Esta es una gran respuesta, pero ¿por qué llamas al equilibrio un equilibrio estable?
Giskard
1
@denesp Supongo que es redundante.
f ''