He leído sobre la paradoja de la apuesta de Blackwell en el armario de Futility . Aquí está el resumen: se le presentan dos sobres, y . Los sobres contienen una cantidad aleatoria de dinero, pero no sabe nada sobre la distribución del dinero. Abre uno, verifica cuánto dinero hay allí ( ) y tiene que elegir: tomar el sobre o ?
Futility Closet se refiere a un matemático llamado Leonard Wapner: "Inesperadamente, hay algo que puede hacer, aparte de abrir el otro sobre, para darse una oportunidad mejor que incluso de hacerlo bien".
La idea, que me parece incorrecta, es la siguiente: elegir un número aleatorio . Si , tome . Si , elija .
Wapner: “Si d cae entre x e y, entonces su predicción (como lo indica d) se garantiza que es correcta. Suponga que esto ocurre con probabilidad p. Si d cae menos que x e y, entonces su predicción será correcta solo en el caso de que su número elegido x sea el mayor de los dos. Hay un 50 por ciento de posibilidades de esto. Del mismo modo, si d es mayor que ambos números, su predicción será correcta solo si su número elegido es el menor de los dos. Esto ocurre con una probabilidad del 50 por ciento también ".
Si la probabilidad de que esté en es mayor que cero, entonces el éxito promedio de este método es . Esto significaría que al observar una variable aleatoria no relacionada nos da información adicional.
Creo que todo esto está mal y que el problema radica en elegir un número aleatorio de números enteros. Qué significa eso? Como, cualquier número entero? En ese caso, la probabilidad que encuentre entre e es cero, porque tanto como son finitas.d x y x y
Si decimos que hay un límite en la cantidad máxima de dinero, digamos , o al menos elegimos d de , entonces la receta se reduce al consejo trivial de elegir si y eligiendo si .1 ... M E y x < M / 2 E x x > M / 2
¿Echo de menos algo aquí?
EDITAR
Bien, ahora empiezo a ver de dónde viene la aparente paradoja. Me pareció imposible que una variable aleatoria no relacionada pueda proporcionar información adicional.
Sin embargo, tenga en cuenta que debemos elegir conscientemente una distribución de d . Por ejemplo, elija los límites para una distribución uniforme, o de la distribución Poissionian, etc. Claramente, si estamos jugando por maní, y elegimos que la distribución de d sea uniforme en dólares, . Esta última probabilidad dependerá ante todo de nuestro juicio sobre lo que puede estar en los sobres.[ 10 9 , 2 ⋅ 10 9 ] P ( d ∈ ( x , y ) ) = 0
En otras palabras, si la técnica funciona, se viola la suposición de que no sabemos cuál es la distribución del dinero en los sobres (cómo se eligió la cantidad de dinero para los sobres). Sin embargo, si realmente no sabemos qué hay en los sobres, entonces, en el peor de los casos, no perdemos nada al aplicarlo.
EDITAR 2
Otro pensamiento Dada , elija, para dibujar , una distribución continua no negativa tal que . Se nos permite hacer eso, ¿estoy en lo correcto? Procedemos según las instrucciones: si , conservamos el sobre, si , cambiamos el sobre. El razonamiento no cambia, dependiendo de cómo elijamos la distribución, puede ser que (¿o me equivoco?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d ∈ [ x , y ] ) > 0
Sin embargo, dada la forma en que elegimos la distribución, lo que hacemos ahora es equivalente a un lanzamiento de moneda. Lanzamos una moneda, y si es cara, cambiamos los sobres, si son colas, nos pegamos al sobre que tenemos. Donde me equivoco
EDITAR 3 :
OK, lo entiendo ahora. Si basamos la función de probabilidad de en (p. Ej., Tomamos muestras de de una distribución uniforme en el rango , entonces la probabilidad no es independiente de .x d ( 1 , 2 ⋅ x ) P ( d ∈ ( x , y ) ) P ( decisión correcta | d ∉ ( x , y ) )
Entonces, si (con probabilidad ), la suposición siempre es correcta, como antes. Sin embargo, si es el número más bajo y , entonces tiene una mayor probabilidad de ser menor que que ser mayor que , por lo que estamos predispuestos hacia una decisión incorrecta. Se aplica el mismo razonamiento cuando es el mayor de los dos números.p x d ∉ ( x , y ) d x x x
Eso significa que tenemos que elegir el proceso de dibujar independientemente de . En otras palabras, debemos adivinar los parámetros de distribución a partir de los cuales se extraen e ; Lo peor que sucede es que todavía adivinamos al azar, pero lo mejor es que nuestra suposición fue correcta, y luego tenemos una ventaja. Cómo debería ser esto mejor que adivinar "x e y, creo, será al menos 1 $ , pero como máximo 10 $ , así que si , lo conservamos, y si no, lo intercambiamos" Todavía estoy por ver.x x y x > 5
Fui engañado por la formulación pop-sci del problema en el libro de Wapner ( Expectativas inesperadas: las curiosidades de una bola de cristal matemática ), que establece
"De cualquier forma, seleccione un número entero aleatorio positivo" (Wapner sugiere una distribución geométrica - arrojando monedas hasta que salgan las primeras cabezas, repitiendo el proceso si ) "Si adivina más alto y si adivina más bajo. (...) ¡Adivinará correctamente más del 50 por ciento de las veces porque apunta correctamente más del 50 por ciento de las veces! "d > x d < x d
fuente
Respuestas:
Esto se conoce más ampliamente como el problema de los dos sobres . Por lo general, las cantidades se dan como y pero no es necesario que este sea el caso.2 AA 2A
Algunos puntos:
No puede elegir un entero aleatorio de manera uniforme *, pero la parte citada no parece requerir que sea uniforme. Elija una distribución, no importa cuál sea el argumento, siempre que tenga alguna probabilidad de exceder cualquier valor finito.
No tendría sentido elegir entero con la regla de decisión citada, porque el dinero es discreto, lo que significa que hay una probabilidad distinta de cero no hay nada listado para ese caso. (O, alternativamente, modificar la regla para especificar qué hacer cuando son iguales)d = xd d=x
Dejando eso de lado, puede elegir de alguna distribución continua no negativa, entonces no tenemos que preocuparnos por la igualdad.d
* (ni puede elegir un entero no aleatorio uniformemente aleatorio ni un entero positivo uniformemente aleatorio)
Si resulta que la distribución aleatoria de la que se elige abarca esto debería funcionar (le da más de 50-50); si la distribución está atascada en la mitad, no lo haría.M / 2x M/2
Sin embargo, las versiones de este juego que me presentaron por primera vez es que el sobre es presentado por alguien que (posiblemente) busca minimizar sus ingresos del juego. La estrategia de usar una distribución para decidir si cambiar al otro sobre seguirá funcionando en esa instancia.
fuente
¡El argumento de Wapner es correcto!
Algunos comentarios:
Un problema relacionado pero diferente:
Como varios @Glen_b y @whuber han mencionado, hay un acertijo relacionado conocido como el Problema de los Dos Sobres en el que se da un argumento falaz para cambiar siempre los sobres y la falla en el argumento se puede ver al adoptar un enfoque bayesiano y agregar creencias previas sobre el contenido de los dos sobres.
Sin embargo, en cierto sentido, el rompecabezas descrito aquí es bastante diferente. ¡El argumento de Wapner es correcto!
fuente
Esto me intrigó y tomé el enfoque pragmático de jugar con él en Excel.
Generé tres números aleatorios para x, y, yd en el rango 1-100. Luego hice la comparación entre d y x y entre x e y miré el resultado, correcto o incorrecto.
Hice esto 500 veces y lo repetí varias veces y regularmente obtuve la respuesta correcta alrededor de 330 de 500, como se predijo.
Luego aumenté el rango de d a 1-10000 y la respuesta correcta se redujo a aproximadamente 260 para 500 carreras.
Entonces, sí, la selección de d depende de los valores esperados de x e y.
Beto
fuente
Creo que la paradoja aparente con la expansión de Wapner de la ecuación p + (1-p) / 2 es que supone que (1-p) / 2> 0. Para muchos rangos de d, este valor es 0.
Por ejemplo: cualquier d seleccionada de una distribución simétrica centrada en el valor en la envolvente abierta, da una probabilidad de 1/2 incorrecta y 1/2 correcta.
Cualquier distribución elegida asimétricamente parece sesgar la elección de la manera incorrecta la mitad del tiempo.
Entonces, ¿hay alguna manera de elegir un rango y distribución para d tal que esta ecuación se mantenga?
fuente