Monty Hall Problema con un Monty Falible

23

Monty sabía perfectamente si la Puerta tenía una cabra detrás (o estaba vacía). Este hecho permite al jugador duplicar su tasa de éxito a lo largo del tiempo al cambiar las "conjeturas" a la otra puerta. ¿Y si el conocimiento de Monty fuera menos que perfecto? ¿Qué pasa si a veces el Premio realmente estaba en la misma puerta que la Cabra? ¿Pero no pudo verlo hasta después de que eligió y abrió SU puerta? ¿Puede ayudarme a comprender cómo calcular el IF, y en qué medida, el jugador puede mejorar su éxito cuando la tasa de precisión de Monty es inferior al 100%? Por ejemplo: ¿qué pasa si Monty está equivocado, en promedio, el 50% del tiempo? ¿Puede el jugador TODAVÍA beneficiarse de cambiar su Guess / Door? Me imagino que si Monty tiene menos del 33.3% de posibilidades de estar en lo cierto de que el Premio NO está detrás de la Puerta, entonces la mejor opción del Jugador es NO cambiar su elección de Puerta. ¿Puede proporcionarme una manera de calcular el beneficio potencial de cambiar insertando diferentes probabilidades de que Monty sea correcto acerca de que el premio NO esté detrás de la puerta? No tengo nada más que matemáticas de secundaria, y tengo 69 años, así que por favor, sé gentil.


Gracias por las ideas y fórmulas proporcionadas. Parece ser que si "Fallible Monty" tiene solo un 66% de precisión al predecir la ausencia de un Premio / Auto, hay CERO beneficio al cambiar de su elección original de puertas ... porque su tasa de error del 33% es el valor predeterminado tarifa base para que el Premio esté detrás de CUALQUIER puerta. Sin embargo, se supone que si Monty mejora más del 66% al predecir dónde NO HAY PREMIO ENTONCES, el cambio deriva una mayor utilidad. Intentaré aplicar este razonamiento a un juego en el que un "Experto" hace una "predicción experta" de que una de las tres opciones más o menos igualmente probables será la correcta. Tengo poca fe en que el Experto sea correcto, y estoy bastante seguro de que su "índice de aciertos" será inferior al 33%, más como el 15%. Mi conclusión de esto será que cuando el "misma opción que yo, seguramente estoy equivocado, ¡y debería cambiar a uno de los otros dos! ;-)

Pseudoego
fuente
55
Si la precisión de Monty es inferior al 100%, ¿eso significa que a veces abre la puerta con el premio detrás? Si es así, probablemente deberías elegir esa puerta.
Fax

Respuestas:

35

Comencemos con el problema regular de Monty Hall. Tres puertas, detrás de una de las cuales hay un automóvil. Los otros dos tienen cabras detrás de ellos. Eliges la puerta número 1 y Monty abre la puerta número 2 para mostrarte que hay una cabra detrás de esa. ¿Debería cambiar su suposición a la puerta número 3? (Tenga en cuenta que los números que usamos para referirnos a cada puerta no importan aquí. Podríamos elegir cualquier orden y el problema es el mismo, así que para simplificar las cosas podemos usar esta numeración).

La respuesta, por supuesto, es sí, como ya sabes, pero repasemos los cálculos para ver cómo cambian más adelante. Sea do el índice de la puerta con el auto y METRO denote el evento de que Monty reveló que la puerta 2 tiene una cabra. Necesitamos calcular pags(do=3El |METRO) . Si esto es mayor que 1/ /2 , tenemos que cambiar nuestra suposición de que la puerta (ya que sólo tenemos dos opciones restantes). Esta probabilidad viene dada por:

pags(do=3El |METRO)=pags(METROEl |do=3)pags(METROEl |do=1)+pags(METROEl |do=2)+pags(METROEl |do=3)
(Esto es solo aplicar la regla de Bayes con un plano anterior endo)pags(METROEl |do=3)es igual a 1: si el automóvil está detrás de la puerta número 3, entonces Monty no tuvo más remedio que abrir la puerta número 2 como lo hizo. 2: si el automóvil está detrás de la puerta 1, entonces Monty tuvo la opción de abrir cualquiera de las puertas restantes, 2 o 3.ppags(METROEl |do=1) es igual a1/ /2pags(METROEl |do=2) es igual a 0, porque Monty nunca abre la puerta que sabe que tiene el auto. Al completar estos números, obtenemos:
pags(do=3El |METRO)=10,5+0 0+1=23
¿Cuál es el resultado con el que estamos familiarizados?

Ahora consideremos el caso en el que Monty no tiene un conocimiento perfecto de qué puerta tiene el automóvil. Entonces, cuando elige su puerta (a la que nos referiremos como puerta número 2), podría elegir accidentalmente la que tiene el automóvil, porque cree que tiene una cabra. Deje do la puerta que Monty cree que tiene el automóvil, y sea pags(doEl |do) la probabilidad de que él piense que el automóvil está en un lugar determinado, condicional a su ubicación real. Asumiremos que esto se describe mediante un único parámetro q que determina su precisión, de modo que: pags(do=XEl |do=X)=q=1-pags(doXEl |do=X)es 0, Monty siempre está equivocado (lo que sigue siendo informativo). Si q es 1 / 3 , la información de Monty no es mejor que adivinar al azar es. . Siq es igual a 1, Monty siempre tiene razón. Siqq1/ /3

Esto significa que ahora tenemos:

pags(METROEl |do=3)=Xpags(METROEl |do=X)pags(do=XEl |do=3)
=pags(METROEl |do=1)pags(do=1El |do=3)+pags(METROEl |do=2)pags(do=2El |do=3)+pags(METROEl |do=3)pags(do=3El |do=3)
=12×12(1-q)+0 0×12(1-q)+1×q
=14 4-q4 4+q=34 4q+14 4

Es decir, si el automóvil estaba realmente detrás de la puerta 3, había tres posibilidades que podrían haber jugado: (1) Monty pensó que estaba detrás de 1, (2) Monty pensó 2 o (3) Monty pensó 3. La última opción ocurre con probabilidad q (con qué frecuencia lo hace bien), los otros dos dividen la probabilidad de que se equivoque (1-q) entre ellos. Entonces, dado cada escenario, ¿cuál es la probabilidad de que hubiera elegido señalar la puerta número 2, como lo hizo? Si pensara que el automóvil estaba detrás de 1, esa probabilidad era 1 en 2, ya que podría haber elegido 2 o 3. Si pensara que estaba detrás de 2, nunca hubiera elegido apuntar a 2. Si pensara que estaba detrás de 3 , él siempre habría elegido 2.

De manera similar, podemos calcular las probabilidades restantes:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12-q2=12

pags(METROEl |do=2)=Xpags(METROEl |do=X)pags(do=XEl |do=2)
=12×12(1-q)+1×12(1-q)
=34 4-34 4q

Al completar todo esto, obtenemos:

pags(do=3El |METRO)=34 4q+14 412+34 4-34 4q+34 4q+14 4
=0,75q+0.251,5
Como verificación de cordura, cuandoq=1, podemos ver que recuperamos nuestra respuesta original de11,5=23 .

Entonces, ¿cuándo deberíamos cambiar? Asumiré por simplicidad que no se nos permite cambiar a la puerta que Monty señaló. Y, de hecho, mientras Monty sea al menos algo probable que sea correcto (más que adivinar al azar), la puerta a la que señala siempre será menos probable que los demás para tener el automóvil, por lo que esta no es una opción viable para nosotros de todos modos Por lo tanto, solo tenemos que considerar las probabilidades de las puertas 1 y 3. Pero mientras que antes era imposible que el automóvil estuviera detrás de la puerta 2, esta opción ahora tiene una probabilidad distinta de cero, por lo que ya no es el caso de que debamos cambiar cuando p(C=3|M)>0.5 , sino que deberíamos cambiar cuando p(C=3|M)>p(C=1|M) (que solía ser lo mismo). Esta probabilidad viene dada porp(C=1|M)=0.51.5=13 , igual que en el problema original de Monty Hall. (Esto tiene sentido ya que Monty nunca puede apuntar hacia la puerta 1, independientemente de lo que esté detrás, por lo que no puede proporcionar información sobre esa puerta. Más bien, cuando su precisión cae por debajo del 100%, el efecto es que alguna probabilidad "se escapa" hacia la puerta 2 en realidad tiene el auto.) Entonces, necesitamos encontrarqtal quep(C=3|M)>13 :

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Entonces, básicamente, esta era una forma muy larga de descubrir que, siempre y cuando el conocimiento de Monty sobre la verdadera ubicación del automóvil sea mejor que una suposición aleatoria, debe cambiar las puertas (lo que en realidad es algo obvio, cuando piensa en eso). También podemos calcular cuánto más probabilidades tenemos de ganar cuando cambiamos, en función de la precisión de Monty, ya que esto viene dado por:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(que, cuandoq=1 , da una respuesta de 2, igualando el hecho de que duplicamos nuestras posibilidades de ganar cambiando las puertas en el problema original de Monty Hall).

Editar: La gente preguntaba sobre el escenario en el que se nos permite cambiar a la puerta que señala Monty, lo que se vuelve ventajoso cuando q<13 , es decir, cuando Monty es un "mentiroso" (algo) confiable. En el escenario más extremo, cuandoq=0, esto significa que la puerta que Monty cree que realmente tiene el auto tiene una cabra. Sin embargo, tenga en cuenta que las dos puertas restantes aún podrían tener un automóvil o una cabra.

El beneficio de cambiar a la puerta 2 viene dado por:

pags(do=2El |METRO)pags(do=1El |METRO)=0,75-0,75q1,513=1,5-1,5q
Que solo es mayor que 1 (y por lo tanto vale la pena cambiar a esa puerta) si1,5q<0,5, es decir, siq<13 , que ya establecimos fue el punto de inflexión. Curiosamente, el beneficio máximo posible para cambiar a la puerta 2, cuandoq=0 0, es solo 1.5, en comparación con una duplicación de sus probabilidades de ganar en el problema original de Monty Hall (cuandoq=1 ).

La solución general se da combinando estas dos estrategias de conmutación: cuando q>13 , siempre cambias a la puerta 3; de lo contrario, cambie a la puerta 2.

Ruben van Bergen
fuente
¿No volvería a subir el valor esperado cuando q < 1/3, porque no está modelando la probabilidad de que sea exacto, sino la probabilidad de que esté equivocado? Al acercarse a 0 significaría que siempre está mintiendo si puede, y sus ganancias esperadas volverían a 2/3
Cireo
2
@Cireo Él no estaría mintiendo, simplemente estaría equivocado. Mentir implicaría que él supiera que su respuesta era incorrecta. Sospecho que la razón por la que el valor esperado no vuelve a subir es porque la posibilidad de que accidentalmente señale la puerta con el automóvil detrás (es decir, p (M | C = 2) está subiendo) y no puede elegir esa puerta, pase lo que pase). q = 0 significa que siempre recuerda mal dónde está el automóvil, es decir, ahora hay una posibilidad relativamente alta de que señale a la puerta con el automóvil detrás.
Buurman
3
Una solución más general (que esto obviamente necesita) incluye un Monty "hostil"; alguien que cambia lo que señala (o incluso si señala algo) dependiendo de si eligió una cabra o un automóvil.
Yakk
3
@Yakk: Hay infinitos escenarios más que puedes imaginar que cambian las probabilidades de infinitas maneras. También todo depende de si sabes cómo funciona Monty. Si sabes que es hostil, entonces en realidad no puede disminuir tus probabilidades por debajo de 1/3, porque simplemente decidirías ignorar lo que sea que haga. Si no conoce su proceso de decisión, entonces depende totalmente de lo que asuma y de lo que haga exactamente, y hay muchos grados de libertad allí.
Ruben van Bergen
1
@KalevMaricq: I didn't really talk about lying Monty. The problem with that is the car could be behind the door you initially picked, which Monty isn't allowed to choose (otherwise, I would argue it's no longer the Monty Hall problem). So he may only have two goat-doors he can choose from, in which case he cannot lie by saying there's a goat behind one of them. So I don't think it's possible to construct a true "liar Monty" within the confines of the problem. What I went with instead (for q=0) is a Monty who always mistakes a goat-door for the car-door, but we don't know which goat-door.
Ruben van Bergen
7

Esta debería ser una variación bastante simple del problema (aunque observo sus antecedentes matemáticos limitados, así que supongo que es relativo). Sugeriría que primero intente determinar la solución condicional si Monte es infalible o completamente falible. El primer caso es solo el problema ordinario de Monte Hall, por lo que no se requiere trabajo allí. En el segundo caso, tratarías la puerta que elige como aleatoria sobre todas las puertas, incluida la puerta con el premio (es decir, aún podría elegir una puerta sin premio, pero ahora es aleatorio). Si puede calcular la probabilidad de ganar en cada uno de estos casos, entonces puede usar la ley de probabilidad total to determine the relevant win probabilities in the case where Monte has some specified level of fallibility (specified by a probability that we is infallible versus fully fallible).

Reinstate Monica
fuente
2
Agradezco la respuesta, pero estaba buscando algo más específico. Estoy especificando que Monty ha elegido una puerta. Estoy especificando que la probabilidad de que el Premio esté detrás de esa puerta podría ser de cero a 100%. Esperaba una fórmula que me permitiera simplemente ingresar la probabilidad de que Monty esté en lo correcto / incorrecto y luego calcular el resto de la fórmula proporcionaría una estimación numérica que indica la probabilidad de que el cambio resulte en una victoria. ¿Es ese grado de asistencia una solicitud poco realista?
Pseudoego
4

Según los comentarios sobre la respuesta de Ben, voy a ofrecer dos interpretaciones diferentes de esta variante de Monty Hall, que difieren de las de Ruben van Bergen.

Al primero lo llamaré Liar Monty y al segundo Monty no confiable. En ambas versiones, el problema continúa de la siguiente manera:

(0) Hay tres puertas, detrás de una de las cuales hay un automóvil y detrás de las otras dos cabras, distribuidas al azar.

(1) El concursante elige una puerta al azar.

(2) Monty elige una puerta diferente a la puerta del concursante y afirma que hay una cabra detrás de ella.

(3) Se le ofrece al concursante cambiar a la tercera puerta no seleccionada, y el problema es "¿Cuándo debe cambiar el concursante para maximizar la probabilidad de encontrar un automóvil detrás de la puerta?"

En Liar Monty, en el paso (2), si el concursante ha elegido una puerta que contiene una cabra, entonces Monty elige una puerta que contiene el automóvil con alguna probabilidad predefinida (es decir, existe una posibilidad entre 0 y 100% de que mienta la cabra está detrás de alguna puerta). Tenga en cuenta que en esta variante, Monty nunca elige una puerta que contenga el automóvil (es decir, no puede mentir) si el concursante eligió el automóvil en el paso (1).

En Monty no confiable, existe una probabilidad predefinida de que la puerta que elija Monty en el paso (2) contenga un automóvil. Tomo de su comentario sobre la respuesta de Ben que este es el escenario en el que está interesado, y mis dos versiones difieren de las de Ruben van Bergen. Tenga en cuenta que Monty no confiable no es lo mismo que Liar Monty; diferenciaremos rigurosamente entre estos dos casos más adelante. Pero considere esto, en este escenario, la puerta de Monty nunca puede contener el automóvil más de23 del tiempo, ya que el concursante tiene una probabilidad de elegir el auto 13 del tiempo.

Para responder al problema, vamos a tener que usar algunas ecuaciones. Voy a tratar de formular mi respuesta para que sea accesible. Las dos cosas que espero no sean demasiado confusas son la manipulación algebraica de símbolos y la probabilidad condicional. Para el primero, usaremos símbolos para denotar lo siguiente:

S=El auto está detrás de la puerta a la que el concursante puede cambiar.S¯=El automóvil no está detrás de la puerta a la que el concursante puede cambiarse.METRO=El auto está detrás de la puerta que eligió Monty.METRO¯=El auto no está detrás de la puerta que eligió Monty.do=El automóvil está detrás de la puerta que el concursante eligió en el paso (1).do¯=El automóvil no está detrás de la puerta que el concursante eligió en el paso (1).

Usamos Pr() para denotar "la probabilidad de ", así que, juntos, algo así como Pr(METRO¯)significa la probabilidad de que el auto no esté detrás de la puerta que eligió Monty. (Es decir, donde sea que vea una expresión que involucre los símbolos, reemplace los símbolos con los equivalentes "en inglés").

We will also require some rudimentary understanding of conditional probability, which is roughly the probability of something happening if you have knowledge of another related event. This probability will be represented here by expressions such as Pr(S|M¯). The vertical bar | can be thought of as the expression "if you know", so that Pr(S|M¯) can be read as "the probability that the door the contestant can switch to has the car, if you know that the car is not behind Monty's door. In the original Monty Hall problem, Pr(S|M¯)=23, which is larger than Pr(S)=13, which corresponds to the case when Monty has not given you any information.

Ahora demostraré que Monty no confiable es equivalente a Liar Monty. En Liar Monty, se nos da la cantidadPr(METROEl |do¯), la probabilidad de que Monty mienta sobre su puerta, sabiendo que el concursante no ha elegido el auto. En Monty no confiable, se nos da la cantidadPr(METRO), la probabilidad de que Monty mienta sobre su puerta. Usando la definición de probabilidad condicional Pr(METRO y do¯)=Pr(do¯El |METRO)Pr(METRO)=Pr(METROEl |do¯)Pr(do¯), y reorganizando, obtenemos:

Pr(METRO)=Pr(METROEl |do¯)Pr(do¯)Pr(do¯El |METRO)32Pr(METRO)=Pr(METROEl |do¯),
ya que Pr(do¯), la probabilidad de que el automóvil no esté detrás de la puerta elegida por el concursante es 23 y Pr(do¯El |METRO), the probability that the car is not behind the contestant's chosen door, if we know that it is behind Monty's door, is one.

Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car 23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.

Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculate Pr(S). Using the law of total probability:

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
since Pr(S|C)=Pr(S|C¯ and M)=0 and Pr(S|C¯ and M¯)=1 (convince yourself of this!).

Continuing:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"Agregué más detalles en mi comentario a @alex: Monty nunca es hostil ni desviado, simplemente FALIBLE, ya que a veces puede estar equivocado por cualquier motivo, y nunca abre la puerta. La investigación muestra que Monty está equivocado aproximadamente el 33.3% de los tiempo, y el automóvil en realidad resulta estar allí. Esa es una probabilidad posterior de estar en lo correcto el 66.6% del tiempo, ¿correcto? Monty nunca elige SU puerta, y usted nunca elegirá la suya . ¿Estas suposiciones cambian algo? "

Esto es, según tengo entendido, el problema no confiable de Monty Hall presentado al comienzo de mi respuesta.

Por lo tanto, si la puerta de Monty contiene el auto 13 de las veces, tenemos la probabilidad de ganar cuando cambias a la última puerta no seleccionada como:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)

Alex
fuente
Alex y @Ruben van Bergen et al. Gracias por los útiles detalles. Asuma que Monty nunca es hostil, simplemente falible y le dice "Estoy bastante seguro de que el auto NO está detrás de esta puerta". pero no abre la puerta Supongamos que la investigación muestra que está EQUIVOCADO solo aproximadamente el 33.3% del tiempo, por lo tanto, corrige el 66.6% (¿una probabilidad posterior?). Todavía hay algún beneficio en el cambio, pero una vez que su precisión alcance solo el 33.3%, NO tendría sentido cambiar a SU puerta ni a la otra. Literalmente, un caso de "su suposición es tan buena como la mía". ¿Algo de esto cambia sus análisis o fórmulas?
Pseudoego
No, this doesn't change my analysis. I added something which I hope clarifies the question in your comment. Btw, I wouldn't read too much into the words "hostile", "fallible", "monty lies". These don't really mean anything unless defined with precision as the (conditional) probability that Monty is wrong about a door containing a goat.
Alex
Bastante molesto porque mi PROPIA respuesta a MI PROPIA pregunta sería eliminada con la única explicación dada es que este sitio no es para "discusión", cuando estoy explicando principalmente por qué creo que las Respuestas dadas hasta ahora son Correctas, y explicando cómo sé útil. Hubo mucha más discusión en la mayoría de las otras respuestas dadas. Esto me parece miope, en el mejor de los casos, y tonto, en el peor de los casos, eliminar la respuesta de alguien a su propia pregunta: ¿cómo puede explicar por qué califica una respuesta como la MEJOR sin discutirla? Gracias a todos los que respondieron independientemente.
Pseudoego
@Pseudoego, su último comentario es mejor publicarlo como comentario en su pregunta original. No vi su respuesta, pero parece que quiere discutir las respuestas existentes, en cuyo caso puede modificar su pregunta original.
Alex
0

Por alguna razón, un moderador decidió eliminar mi propia respuesta a mi propia pregunta, con el argumento de que contenía "discusión". Realmente no veo CÓMO puedo explicar cuál es la mejor respuesta sin discutir lo que hace que funcione para mí y cómo se puede aplicar en la práctica.

Agradezco las ideas y fórmulas que se proporcionaron en las respuestas anteriores. Parece ser que SI "Fallible Monty" tiene solo un 66% de precisión al predecir la ausencia de un Premio / Auto ENTONCES hay CERO beneficio al cambiar de su elección original de puertas ... porque su tasa de error del 33% es el valor predeterminado tarifa base para que el Premio esté detrás de CUALQUIER puerta. Sin embargo, se supone que si Monty mejora más del 66% al predecir dónde NO HAY PREMIO ENTONCES el cambio deriva una mayor utilidad.

Pseudoego
fuente