Monty sabía perfectamente si la Puerta tenía una cabra detrás (o estaba vacía). Este hecho permite al jugador duplicar su tasa de éxito a lo largo del tiempo al cambiar las "conjeturas" a la otra puerta. ¿Y si el conocimiento de Monty fuera menos que perfecto? ¿Qué pasa si a veces el Premio realmente estaba en la misma puerta que la Cabra? ¿Pero no pudo verlo hasta después de que eligió y abrió SU puerta? ¿Puede ayudarme a comprender cómo calcular el IF, y en qué medida, el jugador puede mejorar su éxito cuando la tasa de precisión de Monty es inferior al 100%? Por ejemplo: ¿qué pasa si Monty está equivocado, en promedio, el 50% del tiempo? ¿Puede el jugador TODAVÍA beneficiarse de cambiar su Guess / Door? Me imagino que si Monty tiene menos del 33.3% de posibilidades de estar en lo cierto de que el Premio NO está detrás de la Puerta, entonces la mejor opción del Jugador es NO cambiar su elección de Puerta. ¿Puede proporcionarme una manera de calcular el beneficio potencial de cambiar insertando diferentes probabilidades de que Monty sea correcto acerca de que el premio NO esté detrás de la puerta? No tengo nada más que matemáticas de secundaria, y tengo 69 años, así que por favor, sé gentil.
Gracias por las ideas y fórmulas proporcionadas. Parece ser que si "Fallible Monty" tiene solo un 66% de precisión al predecir la ausencia de un Premio / Auto, hay CERO beneficio al cambiar de su elección original de puertas ... porque su tasa de error del 33% es el valor predeterminado tarifa base para que el Premio esté detrás de CUALQUIER puerta. Sin embargo, se supone que si Monty mejora más del 66% al predecir dónde NO HAY PREMIO ENTONCES, el cambio deriva una mayor utilidad. Intentaré aplicar este razonamiento a un juego en el que un "Experto" hace una "predicción experta" de que una de las tres opciones más o menos igualmente probables será la correcta. Tengo poca fe en que el Experto sea correcto, y estoy bastante seguro de que su "índice de aciertos" será inferior al 33%, más como el 15%. Mi conclusión de esto será que cuando el "misma opción que yo, seguramente estoy equivocado, ¡y debería cambiar a uno de los otros dos! ;-)
fuente
Respuestas:
Comencemos con el problema regular de Monty Hall. Tres puertas, detrás de una de las cuales hay un automóvil. Los otros dos tienen cabras detrás de ellos. Eliges la puerta número 1 y Monty abre la puerta número 2 para mostrarte que hay una cabra detrás de esa. ¿Debería cambiar su suposición a la puerta número 3? (Tenga en cuenta que los números que usamos para referirnos a cada puerta no importan aquí. Podríamos elegir cualquier orden y el problema es el mismo, así que para simplificar las cosas podemos usar esta numeración).
La respuesta, por supuesto, es sí, como ya sabes, pero repasemos los cálculos para ver cómo cambian más adelante. SeaC el índice de la puerta con el auto y M denote el evento de que Monty reveló que la puerta 2 tiene una cabra. Necesitamos calcular p(C=3|M) . Si esto es mayor que 1 / 2 , tenemos que cambiar nuestra suposición de que la puerta (ya que sólo tenemos dos opciones restantes). Esta probabilidad viene dada por:
p ( C= 3 | METRO) = p ( MEl | do= 3 )p ( MEl | do= 1 ) + p ( MEl | do= 2 ) + p ( MEl | do= 3 )
(Esto es solo aplicar la regla de Bayes con un plano anterior endo )p ( MEl | do= 3 ) es igual a 1: si el automóvil está detrás de la puerta número 3, entonces Monty no tuvo más remedio que abrir la puerta número 2 como lo hizo. 2: si el automóvil está detrás de la puerta 1, entonces Monty tuvo la opción de abrir cualquiera de las puertas restantes, 2 o 3.pp ( MEl | do= 1 ) es igual a1 / 2 p ( MEl | do= 2 ) es igual a 0, porque Monty nunca abre la puerta que sabe que tiene el auto. Al completar estos números, obtenemos:
p ( C= 3 | METRO) = 10.5 + 0 + 1= 23
¿Cuál es el resultado con el que estamos familiarizados?
Ahora consideremos el caso en el que Monty no tiene un conocimiento perfecto de qué puerta tiene el automóvil. Entonces, cuando elige su puerta (a la que nos referiremos como puerta número 2), podría elegir accidentalmente la que tiene el automóvil, porque cree que tiene una cabra. Dejedo′ la puerta que Monty cree que tiene el automóvil, y sea p ( C′El | do) la probabilidad de que él piense que el automóvil está en un lugar determinado, condicional a su ubicación real. Asumiremos que esto se describe mediante un único parámetro q que determina su precisión, de modo que: p ( C′= x | do= x ) = q= 1 - p ( C′≠ x | do= x ) es 0, Monty siempre está equivocado (lo que sigue siendo informativo). Si q es 1 / 3 , la información de Monty no es mejor que adivinar al azar es. . Siq es igual a 1, Monty siempre tiene razón. Siq q 1 / 3
Esto significa que ahora tenemos:p ( MEl | do= 3 ) = ∑Xp ( MEl | do′= x ) p ( C′= x | do= 3 )
= p ( MEl | do′= 1 ) p ( C′= 1 | do= 3 ) + p ( MEl | do′= 2 ) p ( C′= 2 | do= 3 )+ p ( MEl | do′= 3 ) p ( C′= 3 | do= 3 )
= 12× 12( 1 - q) + 0 × 12( 1 - q) + 1 × q
= 14 4- q4 4+ q= 34 4q+ 14 4
Es decir, si el automóvil estaba realmente detrás de la puerta 3, había tres posibilidades que podrían haber jugado: (1) Monty pensó que estaba detrás de 1, (2) Monty pensó 2 o (3) Monty pensó 3. La última opción ocurre con probabilidadq (con qué frecuencia lo hace bien), los otros dos dividen la probabilidad de que se equivoque ( 1 - q) entre ellos. Entonces, dado cada escenario, ¿cuál es la probabilidad de que hubiera elegido señalar la puerta número 2, como lo hizo? Si pensara que el automóvil estaba detrás de 1, esa probabilidad era 1 en 2, ya que podría haber elegido 2 o 3. Si pensara que estaba detrás de 2, nunca hubiera elegido apuntar a 2. Si pensara que estaba detrás de 3 , él siempre habría elegido 2.
De manera similar, podemos calcular las probabilidades restantes:p ( MEl | do=1)=∑xp(M|C′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12-q2=12
Al completar todo esto, obtenemos:p ( C= 3 | METRO) = 34 4q+ 14 412+ 34 4- 34 4q+ 34 4q+ 14 4
= 0,75 q+ 0.251,5
Como verificación de cordura, cuandoq= 1 , podemos ver que recuperamos nuestra respuesta original de11,5= 23 .
Entonces, ¿cuándo deberíamos cambiar? Asumiré por simplicidad que no se nos permite cambiar a la puerta que Monty señaló. Y, de hecho, mientras Monty sea al menos algo probable que sea correcto (más que adivinar al azar), la puerta a la que señala siempre será menos probable que los demás para tener el automóvil, por lo que esta no es una opción viable para nosotros de todos modos Por lo tanto, solo tenemos que considerar las probabilidades de las puertas 1 y 3. Pero mientras que antes era imposible que el automóvil estuviera detrás de la puerta 2, esta opción ahora tiene una probabilidad distinta de cero, por lo que ya no es el caso de que debamos cambiar cuandop(C=3|M)>0.5 , sino que deberíamos cambiar cuando p(C=3|M)>p(C=1|M) (que solía ser lo mismo). Esta probabilidad viene dada porp(C=1|M)=0.51.5=13 , igual que en el problema original de Monty Hall. (Esto tiene sentido ya que Monty nunca puede apuntar hacia la puerta 1, independientemente de lo que esté detrás, por lo que no puede proporcionar información sobre esa puerta. Más bien, cuando su precisión cae por debajo del 100%, el efecto es que alguna probabilidad "se escapa" hacia la puerta 2 en realidad tiene el auto.) Entonces, necesitamos encontrarq tal quep(C=3|M)>13 :
0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Entonces, básicamente, esta era una forma muy larga de descubrir que, siempre y cuando el conocimiento de Monty sobre la verdadera ubicación del automóvil sea mejor que una suposición aleatoria, debe cambiar las puertas (lo que en realidad es algo obvio, cuando piensa en eso). También podemos calcular cuánto más probabilidades tenemos de ganar cuando cambiamos, en función de la precisión de Monty, ya que esto viene dado por:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(que, cuandoq=1 , da una respuesta de 2, igualando el hecho de que duplicamos nuestras posibilidades de ganar cambiando las puertas en el problema original de Monty Hall).
Editar: La gente preguntaba sobre el escenario en el que se nos permite cambiar a la puerta que señala Monty, lo que se vuelve ventajoso cuandoq<13 , es decir, cuando Monty es un "mentiroso" (algo) confiable. En el escenario más extremo, cuandoq=0 , esto significa que la puerta que Monty cree que realmente tiene el auto tiene una cabra. Sin embargo, tenga en cuenta que las dos puertas restantes aún podrían tener un automóvil o una cabra.
El beneficio de cambiar a la puerta 2 viene dado por:p(C=2|M)p(C=1|M)=0.75−0.75q1.513= 1.5 - 1.5 q
Que solo es mayor que 1 (y por lo tanto vale la pena cambiar a esa puerta) si1,5 q< 0.5 , es decir, siq< 13 , que ya establecimos fue el punto de inflexión. Curiosamente, el beneficio máximo posible para cambiar a la puerta 2, cuandoq= 0 , es solo 1.5, en comparación con una duplicación de sus probabilidades de ganar en el problema original de Monty Hall (cuandoq= 1 ).
La solución general se da combinando estas dos estrategias de conmutación: cuandoq> 13 , siempre cambias a la puerta 3; de lo contrario, cambie a la puerta 2.
fuente
q < 1/3
, porque no está modelando la probabilidad de que sea exacto, sino la probabilidad de que esté equivocado? Al acercarse a 0 significaría que siempre está mintiendo si puede, y sus ganancias esperadas volverían a 2/3Esta debería ser una variación bastante simple del problema (aunque observo sus antecedentes matemáticos limitados, así que supongo que es relativo). Sugeriría que primero intente determinar la solución condicional si Monte es infalible o completamente falible. El primer caso es solo el problema ordinario de Monte Hall, por lo que no se requiere trabajo allí. En el segundo caso, tratarías la puerta que elige como aleatoria sobre todas las puertas, incluida la puerta con el premio (es decir, aún podría elegir una puerta sin premio, pero ahora es aleatorio). Si puede calcular la probabilidad de ganar en cada uno de estos casos, entonces puede usar la ley de probabilidad total to determine the relevant win probabilities in the case where Monte has some specified level of fallibility (specified by a probability that we is infallible versus fully fallible).
fuente
Según los comentarios sobre la respuesta de Ben, voy a ofrecer dos interpretaciones diferentes de esta variante de Monty Hall, que difieren de las de Ruben van Bergen.
Al primero lo llamaré Liar Monty y al segundo Monty no confiable. En ambas versiones, el problema continúa de la siguiente manera:
(0) Hay tres puertas, detrás de una de las cuales hay un automóvil y detrás de las otras dos cabras, distribuidas al azar.
(1) El concursante elige una puerta al azar.
(2) Monty elige una puerta diferente a la puerta del concursante y afirma que hay una cabra detrás de ella.
(3) Se le ofrece al concursante cambiar a la tercera puerta no seleccionada, y el problema es "¿Cuándo debe cambiar el concursante para maximizar la probabilidad de encontrar un automóvil detrás de la puerta?"
En Liar Monty, en el paso (2), si el concursante ha elegido una puerta que contiene una cabra, entonces Monty elige una puerta que contiene el automóvil con alguna probabilidad predefinida (es decir, existe una posibilidad entre 0 y 100% de que mienta la cabra está detrás de alguna puerta). Tenga en cuenta que en esta variante, Monty nunca elige una puerta que contenga el automóvil (es decir, no puede mentir) si el concursante eligió el automóvil en el paso (1).
En Monty no confiable, existe una probabilidad predefinida de que la puerta que elija Monty en el paso (2) contenga un automóvil. Tomo de su comentario sobre la respuesta de Ben que este es el escenario en el que está interesado, y mis dos versiones difieren de las de Ruben van Bergen. Tenga en cuenta que Monty no confiable no es lo mismo que Liar Monty; diferenciaremos rigurosamente entre estos dos casos más adelante. Pero considere esto, en este escenario, la puerta de Monty nunca puede contener el automóvil más de23 del tiempo, ya que el concursante tiene una probabilidad de elegir el auto 13 del tiempo.
Para responder al problema, vamos a tener que usar algunas ecuaciones. Voy a tratar de formular mi respuesta para que sea accesible. Las dos cosas que espero no sean demasiado confusas son la manipulación algebraica de símbolos y la probabilidad condicional. Para el primero, usaremos símbolos para denotar lo siguiente:
UsamosPr ( ∗ ) para denotar "la probabilidad de ∗ ", así que, juntos, algo así como Pr ( M¯) significa la probabilidad de que el auto no esté detrás de la puerta que eligió Monty. (Es decir, donde sea que vea una expresión que involucre los símbolos, reemplace los símbolos con los equivalentes "en inglés").
We will also require some rudimentary understanding of conditional probability, which is roughly the probability of something happening if you have knowledge of another related event. This probability will be represented here by expressions such asPr(S|M¯) . The vertical bar | can be thought of as the expression "if you know", so that Pr(S|M¯) can be read as "the probability that the door the contestant can switch to has the car, if you know that the car is not behind Monty's door. In the original Monty Hall problem, Pr(S|M¯)=23 , which is larger than Pr(S)=13 , which corresponds to the case when Monty has not given you any information.
Ahora demostraré que Monty no confiable es equivalente a Liar Monty. En Liar Monty, se nos da la cantidadPr (MEl | do¯) , la probabilidad de que Monty mienta sobre su puerta, sabiendo que el concursante no ha elegido el auto. En Monty no confiable, se nos da la cantidadPr ( M) , la probabilidad de que Monty mienta sobre su puerta. Usando la definición de probabilidad condicional Pr ( M y C¯) = Pr ( C¯El | METRO) Pr ( M) = Pr ( MEl | do¯) Pr ( C¯) , y reorganizando, obtenemos:
Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.
Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculatePr(S) . Using the law of total probability:
Continuing:
So you see, when Monty always lies (akaPr(M|C¯))=1 ) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S) , is 23 .
From this you can work out the optimal strategies for both Liar, and Unreliable Monty.
Addendum 1
In response to comment (emphasis mine):
Esto es, según tengo entendido, el problema no confiable de Monty Hall presentado al comienzo de mi respuesta.
Por lo tanto, si la puerta de Monty contiene el auto13 de las veces, tenemos la probabilidad de ganar cuando cambias a la última puerta no seleccionada como:
Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)
fuente
Por alguna razón, un moderador decidió eliminar mi propia respuesta a mi propia pregunta, con el argumento de que contenía "discusión". Realmente no veo CÓMO puedo explicar cuál es la mejor respuesta sin discutir lo que hace que funcione para mí y cómo se puede aplicar en la práctica.
Agradezco las ideas y fórmulas que se proporcionaron en las respuestas anteriores. Parece ser que SI "Fallible Monty" tiene solo un 66% de precisión al predecir la ausencia de un Premio / Auto ENTONCES hay CERO beneficio al cambiar de su elección original de puertas ... porque su tasa de error del 33% es el valor predeterminado tarifa base para que el Premio esté detrás de CUALQUIER puerta. Sin embargo, se supone que si Monty mejora más del 66% al predecir dónde NO HAY PREMIO ENTONCES el cambio deriva una mayor utilidad.
fuente