La apuesta de Blackwell

12

He leído sobre la paradoja de la apuesta de Blackwell en el armario de Futility . Aquí está el resumen: se le presentan dos sobres, y . Los sobres contienen una cantidad aleatoria de dinero, pero no sabe nada sobre la distribución del dinero. Abre uno, verifica cuánto dinero hay allí ( ) y tiene que elegir: tomar el sobre o ?ExEyxExEy

Futility Closet se refiere a un matemático llamado Leonard Wapner: "Inesperadamente, hay algo que puede hacer, aparte de abrir el otro sobre, para darse una oportunidad mejor que incluso de hacerlo bien".

La idea, que me parece incorrecta, es la siguiente: elegir un número aleatorio . Si , tome . Si , elija .dd<xExd>xEy

Wapner: “Si d cae entre x e y, entonces su predicción (como lo indica d) se garantiza que es correcta. Suponga que esto ocurre con probabilidad p. Si d cae menos que x e y, entonces su predicción será correcta solo en el caso de que su número elegido x sea el mayor de los dos. Hay un 50 por ciento de posibilidades de esto. Del mismo modo, si d es mayor que ambos números, su predicción será correcta solo si su número elegido es el menor de los dos. Esto ocurre con una probabilidad del 50 por ciento también ".

Si la probabilidad de que esté en es mayor que cero, entonces el éxito promedio de este método es . Esto significaría que al observar una variable aleatoria no relacionada nos da información adicional.d[x,y]12+p2

Creo que todo esto está mal y que el problema radica en elegir un número aleatorio de números enteros. Qué significa eso? Como, cualquier número entero? En ese caso, la probabilidad que encuentre entre e es cero, porque tanto como son finitas.d x y x ypdxyxy

Si decimos que hay un límite en la cantidad máxima de dinero, digamos , o al menos elegimos d de , entonces la receta se reduce al consejo trivial de elegir si y eligiendo si .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

¿Echo de menos algo aquí?

EDITAR

Bien, ahora empiezo a ver de dónde viene la aparente paradoja. Me pareció imposible que una variable aleatoria no relacionada pueda proporcionar información adicional.

Sin embargo, tenga en cuenta que debemos elegir conscientemente una distribución de d . Por ejemplo, elija los límites para una distribución uniforme, o de la distribución Poissionian, etc. Claramente, si estamos jugando por maní, y elegimos que la distribución de d sea ​​uniforme en dólares, . Esta última probabilidad dependerá ante todo de nuestro juicio sobre lo que puede estar en los sobres.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

En otras palabras, si la técnica funciona, se viola la suposición de que no sabemos cuál es la distribución del dinero en los sobres (cómo se eligió la cantidad de dinero para los sobres). Sin embargo, si realmente no sabemos qué hay en los sobres, entonces, en el peor de los casos, no perdemos nada al aplicarlo.

EDITAR 2

Otro pensamiento Dada , elija, para dibujar , una distribución continua no negativa tal que . Se nos permite hacer eso, ¿estoy en lo correcto? Procedemos según las instrucciones: si , conservamos el sobre, si , cambiamos el sobre. El razonamiento no cambia, dependiendo de cómo elijamos la distribución, puede ser que (¿o me equivoco?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Sin embargo, dada la forma en que elegimos la distribución, lo que hacemos ahora es equivalente a un lanzamiento de moneda. Lanzamos una moneda, y si es cara, cambiamos los sobres, si son colas, nos pegamos al sobre que tenemos. Donde me equivoco

EDITAR 3 :

OK, lo entiendo ahora. Si basamos la función de probabilidad de en (p. Ej., Tomamos muestras de de una distribución uniforme en el rango , entonces la probabilidad no es independiente de .x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( decisión correcta | d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Entonces, si (con probabilidad ), la suposición siempre es correcta, como antes. Sin embargo, si es el número más bajo y , entonces tiene una mayor probabilidad de ser menor que que ser mayor que , por lo que estamos predispuestos hacia una decisión incorrecta. Se aplica el mismo razonamiento cuando es el mayor de los dos números.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Eso significa que tenemos que elegir el proceso de dibujar independientemente de . En otras palabras, debemos adivinar los parámetros de distribución a partir de los cuales se extraen e ; Lo peor que sucede es que todavía adivinamos al azar, pero lo mejor es que nuestra suposición fue correcta, y luego tenemos una ventaja. Cómo debería ser esto mejor que adivinar "x e y, creo, será al menos 1 $ , pero como máximo 10 $ , así que si , lo conservamos, y si no, lo intercambiamos" Todavía estoy por ver.x x y x > 5dxxyx>5

Fui engañado por la formulación pop-sci del problema en el libro de Wapner ( Expectativas inesperadas: las curiosidades de una bola de cristal matemática ), que establece

"De cualquier forma, seleccione un número entero aleatorio positivo" (Wapner sugiere una distribución geométrica - arrojando monedas hasta que salgan las primeras cabezas, repitiendo el proceso si ) "Si adivina más alto y si adivina más bajo. (...) ¡Adivinará correctamente más del 50 por ciento de las veces porque apunta correctamente más del 50 por ciento de las veces! "d > x d < x dd=xd>xd<xd

enero
fuente
1
Muy relacionado: stats.stackexchange.com/questions/95694
whuber
2
Esto es bastante diferente del problema de las dos envolventes en el sentido de que: (1) el argumento dado para cambiar el problema de las dos envolventes es falaz, la falla en el argumento se puede ver agregando un Bayesiano anterior mientras que (2) el argumento dada por Wapner para la apuesta de Blackwell es correcta.
Matthew Gunn
Si las cantidades de dinero en los sobres son elementos arbitrarios de un conjunto de números S, una condición suficiente y necesaria para que funcione la estrategia de Wapner es que el CDF del número que elija aumente estrictamente en S.
Restablezca a Monica el
De acuerdo, todavía me falta algo, consulte mi EDIT 2, pero me parece que podríamos lanzar una moneda y aún debería funcionar, según el razonamiento. Donde me equivoco
Enero

Respuestas:

8

Esto se conoce más ampliamente como el problema de los dos sobres . Por lo general, las cantidades se dan como y pero no es necesario que este sea el caso.2 AA2A

Algunos puntos:

  1. No puede elegir un entero aleatorio de manera uniforme *, pero la parte citada no parece requerir que sea uniforme. Elija una distribución, no importa cuál sea el argumento, siempre que tenga alguna probabilidad de exceder cualquier valor finito.

  2. No tendría sentido elegir entero con la regla de decisión citada, porque el dinero es discreto, lo que significa que hay una probabilidad distinta de cero no hay nada listado para ese caso. (O, alternativamente, modificar la regla para especificar qué hacer cuando son iguales)d = xd d=x

  3. Dejando eso de lado, puede elegir de alguna distribución continua no negativa, entonces no tenemos que preocuparnos por la igualdad.d

* (ni puede elegir un entero no aleatorio uniformemente aleatorio ni un entero positivo uniformemente aleatorio)


Si decimos que hay un límite en la cantidad máxima de dinero, digamos , o al menos elegimos de , entonces la receta se reduce al consejo trivial de elegir si y eligiendo sid 1 ... M E y x < M / 2 E x x > M / 2Md1...MEyx<M/2Exx>M/2

Si resulta que la distribución aleatoria de la que se elige abarca esto debería funcionar (le da más de 50-50); si la distribución está atascada en la mitad, no lo haría.M / 2xM/2

Sin embargo, las versiones de este juego que me presentaron por primera vez es que el sobre es presentado por alguien que (posiblemente) busca minimizar sus ingresos del juego. La estrategia de usar una distribución para decidir si cambiar al otro sobre seguirá funcionando en esa instancia.

Glen_b -Reinstate a Monica
fuente
OK, puntos (1-3) tomados. Por lo tanto, se me permite elegir una distribución continua aleatoria, no negativa de que , ¿correcto? Pero entonces la decisión se basa esencialmente en un lanzamiento de moneda ... ¿estoy equivocado? P ( d < x ) = P ( d > x )dP(d<x)=P(d>x)
Enero
No necesita en absoluto. Solo necesita alguna probabilidad distinta de cero de llegar entre las dos cantidades. P(d<x)=P(d>x)
Glen_b: reinstala a Monica el
Sí, pero se me permite definir la función de densidad para como deseo, ¿verdad? Lo hago para llevar el argumento a una conclusión absurda. d
Enero
Al hacer que tu estrategia sea una función de x, no te estás dando la ventaja de tomar la decisión correcta cuando d está entre x e y, estás definiendo cómo salir de ganar el juego. Si el enlace que da afirma que tal estrategia funcionará, estaría equivocado
Glen_b -Reinstale a Monica el
¿Qué, en el razonamiento de Wapner, me prohíbe definir la función de probabilidad utilizada para derivar como una función de ? Mientras , su razonamiento debería funcionar, ¿me equivoco? Si uso una distribución continua y no negativa que incluye (por ejemplo, distribución uniforme en , entonces tengo la garantía de que este es el caso. Y aún tomo la decisión correcta si .dxP(d(x,y))>0x(1,2x)d(x,y)
Enero
7

¡El argumento de Wapner es correcto!

Algunos comentarios:

  • Siguiendo la estrategia de corte descrita , en la que cambiamos las envolventes si es, en el peor de los casos, inútil en las expectativas ex ante. Con una buena elección de , puede ser bastante útil.x<dd
  • Si agrega un previo Bayesiano (es decir, agrega creencias sobre la distribución inicial de dinero en los sobres), puede resolver el valor óptimo de dadas sus creencias anteriores.d
  • En ciertas situaciones (p. Ej., Mientras más observas, más probable es que obtengas el sobre grande), una estrategia de corte es incluso óptima.
  • En un entorno bayesiano más general, puede hacerlo mejor que una simple estrategia de corte para muchos anteriores.

Un problema relacionado pero diferente:

Como varios @Glen_b y @whuber han mencionado, hay un acertijo relacionado conocido como el Problema de los Dos Sobres en el que se da un argumento falaz para cambiar siempre los sobres y la falla en el argumento se puede ver al adoptar un enfoque bayesiano y agregar creencias previas sobre el contenido de los dos sobres.

Sin embargo, en cierto sentido, el rompecabezas descrito aquí es bastante diferente. ¡El argumento de Wapner es correcto!

Matthew Gunn
fuente
1
Bien, ahora veo de dónde viene la paradoja. O, para ser específicos, dónde fluye la información adicional en el sistema. Al elegir conscientemente la distribución de d , usamos nuestro conocimiento a priori sobre dónde, más o menos, deberían estar las cantidades de dinero en ambos sobres. En el peor de los casos, nuestro conocimiento es inútil, pero el método garantiza que no estaremos en desventaja si lo usamos.
Enero
Después de pensarlo un poco, todavía no lo entiendo - vea EDITAR 2.
Enero
Escenario (A) Imagine que el sobre pequeño tiene y el sobre grande tiene . Elijamos = 15. . ¡La regla de decisión lo llevaría a la elección correcta el 100% del tiempo! 1020dP(x<d)=P(x>d)
Matthew Gunn
Ahora examinemos un Escenario (B). Imagine que el sobre pequeño tiene un número impar de dólares de 1 a 9 (por ejemplo, 1 o 3 o 5 o 7 o 9) y el sobre grande tiene 1 dólar más. Elija y luego . Aquí, sin embargo, su repick si la regla de decisión no es tan útil. Conduce a la decisión correcta si o y a la decisión incorrecta si . Recuerde que los pares posibles son (1,2), (3, 4), (5, 6), (7, 8) (9, 10) $ Lo BAYESIANO ÓPTIMO que debe hacer sabiendo que esta distribución inicial es repick si ve un cantidad impar de dinero P ( x < d ) = P ( x > d ) < 5.5 x = 1 , 3 , 5 , 6 , 8 , 10 x = 2 , 4 , 7 , 9d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
Matthew Gunn
No conocemos la distribución de e , por lo que no podemos elegirla de la manera que usted la propone. Una vez que abrimos el sobre, sabemos , pero no tenemos idea de que se eligió al azar de los enteros 1 a 9, y por lo tanto no podemos elegir que sea ​​5.5. Como se mencionó anteriormente en @Glen_b, debe seleccionarse de una distribución continua no negativa. y x d dxyxdd
Enero
0

Esto me intrigó y tomé el enfoque pragmático de jugar con él en Excel.

Generé tres números aleatorios para x, y, yd en el rango 1-100. Luego hice la comparación entre d y x y entre x e y miré el resultado, correcto o incorrecto.

Hice esto 500 veces y lo repetí varias veces y regularmente obtuve la respuesta correcta alrededor de 330 de 500, como se predijo.

Luego aumenté el rango de d a 1-10000 y la respuesta correcta se redujo a aproximadamente 260 para 500 carreras.

Entonces, sí, la selección de d depende de los valores esperados de x e y.

Beto

usuario121909
fuente
0

Creo que la paradoja aparente con la expansión de Wapner de la ecuación p + (1-p) / 2 es que supone que (1-p) / 2> 0. Para muchos rangos de d, este valor es 0.

Por ejemplo: cualquier d seleccionada de una distribución simétrica centrada en el valor en la envolvente abierta, da una probabilidad de 1/2 incorrecta y 1/2 correcta.

Cualquier distribución elegida asimétricamente parece sesgar la elección de la manera incorrecta la mitad del tiempo.

Entonces, ¿hay alguna manera de elegir un rango y distribución para d tal que esta ecuación se mantenga?

Terry
fuente