Para maximizar la posibilidad de adivinar correctamente el resultado de un lanzamiento de moneda, ¿debería elegir siempre el resultado más probable?

20

Esto no es tarea. Estoy interesado en entender si mi lógica es correcta con este simple problema de estadísticas.

Digamos que tengo una moneda de 2 caras donde la probabilidad de lanzar una cabeza es y la probabilidad de lanzar una cola es . Supongamos que todos los lanzamientos tienen probabilidades independientes. Ahora, digamos que quiero maximizar mis posibilidades de predecir si la moneda será cara o cola en el próximo lanzamiento. Si , puedo adivinar cara o cruz al azar y la probabilidad de que sea correcto es .P(H)P ( H ) = 0.5 0.51P(H)P(H)=0.50.5

Ahora, suponga que , si quiero maximizar mis posibilidades de adivinar correctamente, ¿debería adivinar siempre las colas donde la probabilidad es ?0.8P(H)=0.20.8

Dando un paso más allá, si tuviera un dado de 3 lados, y la probabilidad de sacar un 1, 2 o 3 fuera , y , ¿debería adivinar siempre 2 para maximizar mis posibilidades de adivinar correctamente? ¿Hay otro enfoque que me permita adivinar con mayor precisión?P ( 2 ) = 0.5 P ( 3 ) = 0.4P(1)=0.1P(2)=0.5P(3)=0.4

Tortuga
fuente
44
Me parece que estás preguntando acerca de la independencia: por ejemplo, si tienes cara una vez, ¿eso hace que sea más probable la próxima vez? Si esto no es lo que está preguntando, ¿podría aclarar su pregunta? (Si lo he entendido bien su pregunta, la respuesta es 'sí':. En situaciones como la moneda arroja el resultado más probable será siempre el resultado con la probabilidad más alta, independientemente de lo que ha sucedido con anterioridad)
arbovirus
Gracias por la ayuda @arboviral. Sí, estoy asumiendo la independencia. He actualizado la pregunta para indicar esto.
tortuga
44
Suponiendo independencia, lo mejor que puede hacer es elegir el bando con la mayor probabilidad. Piénsalo de esta manera. No tiene otra información para adivinar mejor. Todo lo que sabes sobre los dados es con qué frecuencia aparece un determinado lado y cuáles fueron los últimos dos lanzamientos. Pero la independencia te dice que las filas anteriores no tienen efecto en el lanzamiento actual. Tal vez si tuviera más información, como la cantidad de fuerza utilizada para lanzar dados, el lanzador izquierdo / derecho o la cantidad de sacudidas antes de lanzar. Sin embargo, si los dados son realmente justos, dudo que incluso ese nivel de detalle proporcione mejores predicciones.
Brent Ferrier
Tu suposición es correcta; es una consecuencia inmediata de la desigualdad de Holder (con los parámetros ). (1,)
whuber
¿Sabes que P (H) = 0.2? ¿O es algo que tienes que resolver observando los resultados?
Akavall

Respuestas:

43

Tienes razón. Si , y está usando cero-una pérdida (es decir, necesita adivinar un resultado real en lugar de una probabilidad o algo así, y además, obtener caras cuando adivinó colas es tan malo como obteniendo colas cuando adivinaste cabezas), debes adivinar colas cada vez.P(H)=0.2

Las personas a menudo piensan erróneamente que la respuesta es adivinar colas en un 80% de ensayos seleccionados al azar y cabezas en el resto. Esta estrategia se llama " coincidencia de probabilidad " y se ha estudiado ampliamente en la toma de decisiones conductuales. Ver, por ejemplo,

West, RF y Stanovich, KE (2003). ¿Es la coincidencia de probabilidad inteligente? Asociaciones entre elecciones probabilísticas y capacidad cognitiva. Memoria y cognición, 31 , 243–251. doi: 10.3758 / BF03194383

Kodiólogo
fuente
1
+1 para el puntero a la coincidencia de probabilidad. ¡Nunca había oído hablar de eso antes, aunque estoy seguro de que lo aprovecho a diario como un sesgo cognitivo! :)
leekaiinthesky
2
(+1) Esto se relaciona con un error común al interpretar modelos de regresión multinomiales y similares: las personas pueden sorprenderse de que la distribución de las clases predichas no coincida con la distribución de las clases observadas, e incluso buscar formas de "arreglarlo" . (Es bueno saber que tiene un nombre.)
Scortchi - Restablece a Monica
1
(+1) para el término "coincidencia de probabilidad".
Haitao Du
13

Básicamente está haciendo una pregunta muy interesante: ¿debería predecir el uso de la estimación máxima a posteriori "MAP Bayesian" o "Real Bayesian"?

Suponga que conoce la distribución verdadera de que , luego, utilizando la estimación MAP, suponga que desea hacer 100 predicciones en los próximos 100 resultados de volteo. Siempre debes adivinar que la vuelta es la cola , NO adivinar cabezas y colas. Esto se llama "MAP Bayesian", básicamente lo estás haciendo20 80P(H)=0.22080

argmaxθf(x|θ)

No es difícil demostrar que al hacerlo puede minimizar el error predicho (pérdida de 0-1). La prueba se puede encontrar en ~ página 53 de Introducción al aprendizaje estadístico .


Hay otra forma de hacer esto llamado enfoque "Real Bayesiano". Básicamente, no está tratando de "seleccionar el resultado con la mayor probabilidad, sino considerar todos los casos de forma probabilística". Por lo tanto, si alguien le pide que "prediga los próximos 100 saltos", debe pausarlo, porque cuando dio 100 resultados binarios, la información probabilística para cada resultado desaparece. En cambio, debe preguntar qué quiere hacer DESPUÉS de conocer los resultados.

Suponga que él / ella tiene alguna función de pérdida (no es necesario para 0-1 pérdida, por ejemplo, la función de pérdida puede ser, si pierde una cabeza, debe pagar $ 1, pero si pierde una cola, debe pagar $ 5, es decir, pérdida desequilibrada) en su predicción, entonces debe usar su conocimiento sobre la distribución de resultados para minimizar la pérdida en toda la distribución

xyp(x,y)L(f(x),y)

, es decir, incorpore su conocimiento sobre la distribución a la pérdida, en lugar de la "manera sabia", obtenga las predicciones y realice los siguientes pasos.

Además, tiene una muy buena intuición sobre lo que tendrá cuando haya muchos resultados posibles. La estimación de MAP no funcionará bien si el número de resultados es grande y la masa de probabilidad está ampliamente distribuida. Piensa que tienes 100 dados laterales y conoces la verdadera distribución. Donde , y . ¿Ahora qué haces con MAP? Siempre adivinará que obtiene el primer lado , ya que tiene la mayor probabilidad en comparación con los demás. ¡Sin embargo, te equivocarás el de las veces!P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%

Haitao Du
fuente
44
El mapa también es bayesiano. Además, usted describe ambos enfoques sin referirse de ninguna manera al uso de lo anterior, lo que puede ser engañoso ya que está escribiendo sobre los métodos bayesianos y los antecedentes son la característica principal de esos métodos.
Tim
"Entonces, si alguien le pide que" pronostique los próximos 100 lanzamientos ", debe negarse a hacerlo" Si ese alguien me ofreciera mil millones de euros si pronostico correctamente, probablemente no me negaría. O probablemente te refieres a 'predecir' en un significado diferente a 'tratar de adivinar'.
JiK
"cuando proporcionó 100 resultados binarios, la información probabilística de cada resultado desaparece" Al principio leí esto como "cuando recibe 100 resultados binarios" y no podía entender la oración, pero ahora me di cuenta de que podría significar "cuando da 100 resultados binarios ". ¿Cuál es correcto, y si es el primero, qué significa?
JiK
1
Un punto muy pequeño: probablemente agregaría una línea vertical después del segundo párrafo para indicar que los dos primeros párrafos son técnicamente suficientes para responder a la pregunta literal y el resto es información adicional (que sin duda es interesante y útil).
JiK
2
En el último párrafo: "La estimación de MAP no funcionará bien si el número de resultados es grande. - ¡Sin embargo, se equivocará el 90% de las veces!" No funcionar bien es siempre una cuestión de contexto. Si este es, por ejemplo, un juego de apuestas repetitivo (el bote se divide entre las personas que adivinan correctamente o devuelven si nadie adivina), la estrategia de MAP seguramente ganará mucho dinero a largo plazo si juegas contra personas que, por ejemplo, sacan sus conjeturas de la distribución de los resultados.
JiK
4

Debido a la independencia, su valor de expectativa siempre se maximiza si adivina el caso más probable. No hay una estrategia mejor porque cada lanzamiento / lanzamiento no le brinda información adicional sobre la moneda / dado.

En cualquier lugar donde adivine un resultado menos probable, su expectativa de ganar es menor que si hubiera adivinado el caso más probable, por lo tanto, es mejor adivinar el caso más probable.

Si quisieras hacerlo de modo que necesitaras cambiar tu estrategia al voltear, podrías considerar una moneda / dado donde inicialmente no conoces las probabilidades y tienes que resolverlas a medida que avanzas.

Kitter Catter
fuente
1
para mí esta respuesta es la explicación más simple; Si tuviera que definir una estrategia considerando el resultado que tenía antes, esto rompería las probabilidades "independientes".
Walfrat