Esto no es tarea. Estoy interesado en entender si mi lógica es correcta con este simple problema de estadísticas.
Digamos que tengo una moneda de 2 caras donde la probabilidad de lanzar una cabeza es y la probabilidad de lanzar una cola es . Supongamos que todos los lanzamientos tienen probabilidades independientes. Ahora, digamos que quiero maximizar mis posibilidades de predecir si la moneda será cara o cola en el próximo lanzamiento. Si , puedo adivinar cara o cruz al azar y la probabilidad de que sea correcto es .P ( H ) = 0.5 0.5
Ahora, suponga que , si quiero maximizar mis posibilidades de adivinar correctamente, ¿debería adivinar siempre las colas donde la probabilidad es ?0.8
Dando un paso más allá, si tuviera un dado de 3 lados, y la probabilidad de sacar un 1, 2 o 3 fuera , y , ¿debería adivinar siempre 2 para maximizar mis posibilidades de adivinar correctamente? ¿Hay otro enfoque que me permita adivinar con mayor precisión?P ( 2 ) = 0.5 P ( 3 ) = 0.4
fuente
Respuestas:
Tienes razón. Si , y está usando cero-una pérdida (es decir, necesita adivinar un resultado real en lugar de una probabilidad o algo así, y además, obtener caras cuando adivinó colas es tan malo como obteniendo colas cuando adivinaste cabezas), debes adivinar colas cada vez.P(H)=0.2
Las personas a menudo piensan erróneamente que la respuesta es adivinar colas en un 80% de ensayos seleccionados al azar y cabezas en el resto. Esta estrategia se llama " coincidencia de probabilidad " y se ha estudiado ampliamente en la toma de decisiones conductuales. Ver, por ejemplo,
West, RF y Stanovich, KE (2003). ¿Es la coincidencia de probabilidad inteligente? Asociaciones entre elecciones probabilísticas y capacidad cognitiva. Memoria y cognición, 31 , 243–251. doi: 10.3758 / BF03194383
fuente
Básicamente está haciendo una pregunta muy interesante: ¿debería predecir el uso de la estimación máxima a posteriori "MAP Bayesian" o "Real Bayesian"?
Suponga que conoce la distribución verdadera de que , luego, utilizando la estimación MAP, suponga que desea hacer 100 predicciones en los próximos 100 resultados de volteo. Siempre debes adivinar que la vuelta es la cola , NO adivinar cabezas y colas. Esto se llama "MAP Bayesian", básicamente lo estás haciendo20 80P(H)=0.2 20 80
No es difícil demostrar que al hacerlo puede minimizar el error predicho (pérdida de 0-1). La prueba se puede encontrar en ~ página 53 de Introducción al aprendizaje estadístico .
Hay otra forma de hacer esto llamado enfoque "Real Bayesiano". Básicamente, no está tratando de "seleccionar el resultado con la mayor probabilidad, sino considerar todos los casos de forma probabilística". Por lo tanto, si alguien le pide que "prediga los próximos 100 saltos", debe pausarlo, porque cuando dio 100 resultados binarios, la información probabilística para cada resultado desaparece. En cambio, debe preguntar qué quiere hacer DESPUÉS de conocer los resultados.
Suponga que él / ella tiene alguna función de pérdida (no es necesario para 0-1 pérdida, por ejemplo, la función de pérdida puede ser, si pierde una cabeza, debe pagar $ 1, pero si pierde una cola, debe pagar $ 5, es decir, pérdida desequilibrada) en su predicción, entonces debe usar su conocimiento sobre la distribución de resultados para minimizar la pérdida en toda la distribución
, es decir, incorpore su conocimiento sobre la distribución a la pérdida, en lugar de la "manera sabia", obtenga las predicciones y realice los siguientes pasos.
Además, tiene una muy buena intuición sobre lo que tendrá cuando haya muchos resultados posibles. La estimación de MAP no funcionará bien si el número de resultados es grande y la masa de probabilidad está ampliamente distribuida. Piensa que tienes 100 dados laterales y conoces la verdadera distribución. Donde , y . ¿Ahora qué haces con MAP? Siempre adivinará que obtiene el primer lado , ya que tiene la mayor probabilidad en comparación con los demás. ¡Sin embargo, te equivocarás el de las veces!P(S1)=0.1 P(S2)=P(S3)=P(S100)=0.9/99=0.009090 S1 90%
fuente
Debido a la independencia, su valor de expectativa siempre se maximiza si adivina el caso más probable. No hay una estrategia mejor porque cada lanzamiento / lanzamiento no le brinda información adicional sobre la moneda / dado.
En cualquier lugar donde adivine un resultado menos probable, su expectativa de ganar es menor que si hubiera adivinado el caso más probable, por lo tanto, es mejor adivinar el caso más probable.
Si quisieras hacerlo de modo que necesitaras cambiar tu estrategia al voltear, podrías considerar una moneda / dado donde inicialmente no conoces las probabilidades y tienes que resolverlas a medida que avanzas.
fuente