¿Qué tiene de malo esta propuesta de resolución a la paradoja de San Petersburgo?

8

Tenemos un juego donde tu pago es 2kdonde es el número de veces que lanzaste una moneda para que cayera en cara (si tu primer lanzamiento es cara, entonces ). Entonces el pago esperado es:kk=1

E=12(2)+14 4(4 4)+18(8)+...
mi=1+1+1+...
mi=

¿Cuánto debo pagar para jugar este juego?

Bueno, sabemos por la distribución geométrica que el número esperado de monedas que lanzaré hasta obtener una cabeza es:

1PAGS(HmiUNAre)=1.5=2

Así que pagaré menos de con :2kk=2

es decir, <4 dólares

https://en.wikipedia.org/wiki/St._Petersburg_paradox para referencia

colorlace
fuente
"bien" necesita referencias. ¿De dónde viene lo "esperado"? Dé un solo ejemplo antes de describir una suma. Audaz la pregunta real. Encuentre una manera de aumentar los "tiempos esperados para obtener una cabeza" ... Recomiendo la simulación. ¿El giro que hizo que la cabeza cuente? Si lo volteas una vez y obtienes una cabeza, ¿es cero antes o uno antes? ¿Puedes demostrar que representaste el "máximo" y no solo el "medio", ¿dónde está la cola correcta? ¿Criterio de Kelly? ( en.wikipedia.org/wiki/Kelly_criterion )
EngrStudent
44
Si valoras la apuesta en $ 4, ¿qué tal si te pago $ 5 para jugar una versión abreviada de la apuesta de San Petersburgo donde puedo ir a lo sumo 10 rondas? ¿Acuerdo?
Matthew Gunn
@EngrStudent El número "esperado" de lanzamientos es igual a la media de una variable aleatoria geométrica. Creo que tienes razón en que debería ser más explícito sobre qué rango estoy usando {0,1,2, ...} o {1,2,3 ...}.
colorlace
@MatthewGunn touché
colorlace

Respuestas:

19
  • Dejar K ser alguna variable aleatoria

    • En tu problema K es la cantidad de veces que volteas antes de obtener cabezas.
  • Dejar F(k) ser alguna función de pago.

    • En tu problema F(k)=2k.
  • Dejar F(K) ser la recompensa

Estás diciendo que una valoración razonable de la apuesta F(K) es dado por F(mi[K]). Esta es una heurística completamente ad-hoc, más bien sin principios. Quizás esté bien en algunas situaciones (por ejemplo, dondeK es pequeño y F casi lineal), pero es fácil construir un ejemplo en el que sugiera algo no sensorial.

Ejemplo donde su sistema no tiene absolutamente ningún sentido

Dejar K ser un empate de la distribución normal norte(0 0,10000000000000) y dejar que la función de pago sea F(K)=K2. Su sistema dice que no debería pagar más de0 0 para esta apuesta porque F(mi[K])=0 02=0 0. ¿Pero no deberías asignar un valor positivo a esta apuesta? ¡Hay una probabilidad del 100% de que la recompensa sea mayor que cero!

Una resolución más clásica de la paradoja de San Petersburgo

Un enfoque es agregar aversión al riesgo. Si tienes suficiente aversión al riesgo, lo que estás dispuesto a pagar para jugar esta apuesta de expectativas infinitas será limitado. Si acepta los axiomas de Von Neumann-Morgernstern , entonces el equivalente de certeza de jugar el juego viene dado porz dónde:

tu(w+z)=mi[tu(w+F(K))]

y donde w es tu riqueza y tues una función cóncava (en jerga, una función de utilidad de Bernoulli) que captura su nivel de aversión al riesgo. Situ es suficientemente cóncava, la valoración de 2K Será finito.

Una función de utilidad de Bernoulli con algunas propiedades agradables resulta ser tu(X)=Iniciar sesión(X). Maximizar la utilidad esperada donde la función de utilidad de Bernoulli es el registro de su riqueza es equivalente a maximizar la tasa de crecimiento esperada de su riqueza. Para apuestas binarias simples, esto le da apuestas Kelly Criterion .

Otro punto importante es que el enfoque de aversión al riesgo conduce a diferentes equivalentes de certeza dependiendo de qué lado de la apuesta se encuentre.

Matthew Gunn
fuente
2
(+1) Además, especificar la distribución de una recompensa no determina únicamente K y F, por lo que la heurística descrita en el primer párrafo necesitaría alguna forma de deducir lo canónico F(K)representación.
Juho Kokkala
2

No hay nada malo con esa resolución propuesta.

En la paradoja original nos fijamos en el valor esperado (media) de la ganancia que es infinita y, por lo tanto, debe apostar una cantidad infinita. Sin embargo, después del primer lanzamiento de la moneda hay un 50% de posibilidades de que haya perdido dinero y es por eso que a la gente no le gusta. Su resolución solo formaliza esto, en lugar de mirar el beneficio medio que está mirando el beneficio medio. A diferencia del beneficio medio, el beneficio medio es finito y la paradoja desaparece.

Hugh
fuente
2
¿Por qué la ganancia media sería relevante? Imagínese la siguiente apuesta: 1% de no obtener nada, 1% de obtener un millónunanortere981. ¿Cuánto pagarías por jugar eso?
Daerdemandt
La excesiva dependencia de @Daerdemandt en la media es lo que causa esta "paradoja". Si apuestas una gran cantidad en un juego como este, entonces hay un 50% de posibilidades de quebrar y una posibilidad de ganar millones. No es irracional tratar de evitar la bancarrota.
Hugh
Dinero ilimitado> dinero enorme. Por lo tanto, en términos de dinero, sería bastante racional jugar si estás de acuerdo con que el juego tome arbitrariamente mucho tiempo. Estas son suposiciones que hacemos para enmarcar el problema estadístico como algo más real. Siendo realistas, tendría problemas para esperar varias vidas para obtener su dinero ilimitado, su utilidad marginal por dinero puede depender de la cantidad de dinero que tenga (diablos, incluso puede carecer de la función de utilidad), y sería bastante escéptico con los extraños ofreciéndole apostar para ganar dinero ilimitado. Pero todo esto está fuera del alcance de las estadísticas.
Daerdemandt
1
En general no, no tenemos que hacerlo. En un problema estadístico de tipo similar se espera que lo hagamos. (Aquí está el juego, ¿cuánto pagarías por jugar?). El dinero es solo una pelusa para que el problema sea menos aburrido. Si quieres desafiar a la pelusa, eres libre de hacerlo, pero eso está fuera del alcance de las estadísticas.
Daerdemandt
1
No estoy seguro exactamente si las personas en general atribuyen un significado suficientemente específico a la palabra "paradoja". Esta es una situación hipotética que estira algunas de las abstracciones usadas. Es útil demostrar que estas abstracciones no son perfectas. Con esa lectura, personalmente agravaría esta situación con otras llamadas "paradojas", su uso puede ser diferente.
Daerdemandt
2

Si entiendo correctamente, su análisis es:

  1. Calcule el número esperado de lanzamientos de monedas necesarios para obtener una cabeza.
  2. Calcule el pago del resultado donde obtiene exactamente el número esperado.
  3. Valorar el juego igual a ese pago.

... OK, modifiquemos ese juego un poco. Al igual que la versión original, lanzaré una moneda y seguiré lanzando hasta que tire las cabezas. Solo los pagos han cambiado:

  • Si me vuelvo loco en el segundo lanzamiento, obtienes cuatro dólares.
  • En cualquier otro resultado, pierdes todo lo que tienes y tienes que venir a trabajar para mí para siempre, gratis.

¿Cuántas monedas esperamos lanzar antes de obtener una cabeza? 2, exactamente lo mismo que antes.

¿Cuál es el pago por el resultado cuando lanzamos dos monedas para obtener una cabeza? $ 4.00, exactamente lo mismo que antes.

¿Cuánto estarías dispuesto a pagar por el 'privilegio' de pagar este juego que tiene un 75% de posibilidades de llevarte a la bancarrota y un 25% de posibilidades de devolver $ 4,00?

Sospecho que la respuesta no es "hasta cuatro dólares, exactamente lo mismo que antes". Lo que significa que hay un agujero en tu lógica.

Desde una perspectiva más amplia, las ganancias esperadas no son necesariamente información suficiente para responder a este tipo de preguntas; generalmente depende de algún contexto adicional. ¿Es esta una oportunidad única o espera que se le ofrezca esta apuesta muchas veces? ¿Cuánto dinero tienes a mano? ¿Y cuánto dinero necesitas para ser feliz?

Por ejemplo, si mi riqueza total es de $ 100 pero necesito urgentemente un millón de dólares para una operación que me salve la vida, estaría dispuesto a pagar todo mi dinero por una sola oportunidad en la apuesta de San Petersburgo. Solo me da una probabilidad de 1/2 ^ 19 de ganar el dinero que necesito, pero si no juego no tengo ninguna posibilidad.

Por otro lado, si mi riqueza total es de $ 1000,000 y necesito exactamente un millón de dólares para esa operación, lo máximo que estaría dispuesto a pagar por un solo juego son dos dólares (que estoy garantizado para recuperar) . Algo más, y tengo 1/2 oportunidad de terminar por debajo del millón de dólares que necesito para salvar mi vida.

Si espero tener muchas oportunidades de jugar tales juegos, entonces probablemente quiera elegir una estrategia que me brinde una alta probabilidad de tener mucho dinero al final de todos esos juegos. Por ejemplo:

El juego A está garantizado para aumentar mi riqueza en un 10% cada vez que lo juego. (Ganador esperado: + 10% de mi riqueza actual.) El juego B tiene un 90% de posibilidades de duplicar mi riqueza y un 10% de posibilidades de llevarme a la bancarrota. (Ganador esperado: + 70% de mi riqueza actual.) [Editar: en realidad + 80% porque fallo en la aritmética básica, pero el argumento sigue vigente].

Si juego 100 iteraciones del Juego A, estoy seguro de multiplicar mi riqueza por 13.780 veces.

Si juego 100 iteraciones del Juego B, tengo un 0.0027% de posibilidades de volverme inimaginablemente rico (aproximadamente 10 ^ 30 x con lo que comencé) ... y un 99.73% de posibilidades de quebrar. Aunque el promedio es mejor que para el Juego A, no es una buena opción.

Para este tipo de juego muy iterado, en lugar de tratar de maximizar mis ganancias esperadas en cada juego, es mejor tratar de maximizar el valor esperado de ln (riqueza total después del juego / riqueza total antes del juego). Esto asegura un crecimiento a largo plazo sin ser eliminado.

Si las apuestas para cada juego son pequeñas en relación con mi riqueza total, entonces esto es aproximadamente equivalente a maximizar las ganancias esperadas en cada juego.

Entonces, si estás jugando muchos juegos y nunca arriesgas una gran parte de tu riqueza actual, entonces el valor esperado de la apuesta te dice todo lo que necesitas saber. En casi cualquier otra situación, también debe pensar en otras cosas.

Geoffrey Brent
fuente
1
+1 Gracias por una respuesta reflexiva que realmente aborda algunos de los problemas fundamentales fundamentales. ¡Bienvenido a nuestro sitio!
whuber