Me hicieron esta pregunta con en una entrevista. ¿Hay una respuesta "correcta"?
Suponga que los lanzamientos son iid y la probabilidad de caras es . La distribución de la cantidad de cabezas en 400 lanzamientos debe estar cerca de Normal (200, 10 ^ 2), de modo que 220 cabezas estén a 2 desviaciones estándar de la media. La probabilidad de observar dicho resultado (es decir, a más de 2 DE de la media en cualquier dirección) es ligeramente inferior al 5%.
El entrevistador me dijo, esencialmente, "si observo algo> = 2 SD de la media, concluyo que está sucediendo algo más. Apostaría a que la moneda sea justa". Eso es razonable, después de todo, eso es lo que hacen la mayoría de las pruebas de hipótesis. ¿Pero es ese el final de la historia? Para el entrevistador esa parecía ser la respuesta "correcta". Lo que pregunto aquí es si algunos matices están justificados.
No pude evitar señalar que decidir que la moneda no es justa es una conclusión extraña en este contexto de lanzamiento de monedas. ¿Tengo razón al decir eso? Trataré de explicar a continuación.
En primer lugar, yo, y supongo que la mayoría de las personas también, tengo un fuerte historial con respecto a las monedas: es muy probable que sean justos. Por supuesto, eso depende de lo que entendamos por justo: una posibilidad sería definir "justo" como "tener una probabilidad de cabezas 'cercanas' a 0.5, digamos entre 0.49 y 0.51".
(También podría definir 'justo' como el significado de que la probabilidad de caras es exactamente 0.50, en cuyo caso ahora parece poco probable tener una moneda perfectamente justa ).
Su prioridad puede depender no solo de sus creencias generales sobre las monedas, sino también del contexto. Si sacó la moneda de su propio bolsillo, podría estar prácticamente seguro de que es justo; Si tu amigo mago lo sacó de él, tu prior podría poner más peso en las monedas de dos cabezas.
En cualquier caso, es fácil encontrar antecedentes razonables que (i) pongan una gran probabilidad de que la moneda sea justa y (ii) hagan que su posterior sea bastante similar, incluso después de observar 220 caras. Luego concluiría que es muy probable que la moneda sea justa, a pesar de observar un resultado 2 SD de la media.
De hecho, también podría construir ejemplos en los que observar 220 caras en 400 lanzamientos haga que su posterior ponga más peso en la moneda, por ejemplo, si todas las monedas injustas tienen una probabilidad de caras en .
¿Alguien puede arrojar algo de luz sobre esto por mí?
Después de escribir esta pregunta, recordé que había escuchado sobre esta situación general antes, ¿no es la "paradoja" de Lindley ?
Whuber puso un enlace muy interesante en los comentarios: puedes cargar un dado, pero no puedes sesgar una moneda . De la página 3:
No tiene sentido decir que la moneda tiene una probabilidad p de cara, porque puede determinarse completamente por la forma en que se la arroja, a menos que se lance en el aire con un giro rápido y quede atrapada en el aire con sin rebote, en cuyo caso p = 1/2.
¡Muy genial! Esto se relaciona con mi pregunta de una manera interesante: supongamos que sabemos que la moneda está "lanzada en el aire con un giro rápido y atrapada en el aire sin rebotar". Entonces definitivamente no deberíamos rechazar la hipótesis de que la moneda es justa (donde "justo" ahora significa "tener p = 1/2 cuando se lanza de la manera descrita anteriormente"), porque efectivamente tenemos un previo que pone toda la probabilidad en el La moneda es justa. Tal vez eso justifique hasta cierto punto por qué me incomoda rechazar el nulo después de observar 220 cabezas.
Respuestas:
La forma Bayesiana estándar de resolver este problema (sin aproximaciones normales) es declarar explícitamente su anterior, combinarlo con su probabilidad, que está distribuida en Beta. Luego integre su posterior alrededor del 50%, digamos dos desviaciones estándar o del 49% al 51% o lo que desee.
Si su creencia anterior es continua en [0,1], por ejemplo, Beta (100,100) (este pone mucha masa en monedas aproximadamente justas), entonces la probabilidad de que la moneda sea justa es cero ya que la probabilidad también es continua [0 , 1].
Incluso si la probabilidad de que la moneda sea justa es cero, generalmente puede responder cualquier pregunta que vaya a responder con el posterior sobre el sesgo. Por ejemplo, cuál es la ventaja del casino dada la distribución posterior sobre las probabilidades de monedas.
fuente
Digamos para la distribución de Bernoulli, en este caso el lanzamiento de una moneda.
Claramente esta es una distribución binomial , y de hecho está cerca de .B(n=400,p=0.5) N(μ=200,σ2=100)
Obviamente, el entrevistador está pidiendo el resultado de con un intervalo de confianza del con , o el valor de .k 95% B(n=400,p=0.5) p B(n=400,p=0.5,k=220)
En el enfoque bayesiano, su prioridad es que lugar de yp=0.5 π(p=0.5)=0.5 π(p≠0.5)=0.5
otro antes más justo que y . Suponemos que tiene una distribución uniforme dentro de cada intervalo.π(0.49≤p≤0.51)=0.9 π(p<0.49∪p>0.51)=0.1 p
Entonces podemos calcular la posterior .P(0.49≤p≤0.51|k=220)
O es muy probable que lo anterior sea una distribución normal ~ , o podemos suponer una varianza mucho menor, como .p N(μ=0.5,σ2=0.25) σ2=0.1
Luego calculamos la distribución posterior de como .p f(p|k=220)
Mi reputación no es suficiente para escribir un comentario bajo la Pregunta. En cambio, voy a escribir algo aquí sobre No se puede sesgar una moneda . @Adrian
Esto es lo que tenemos.
Aquí está nuestra hipótesis
Aquí está nuestro resultado
Dado que el valor para la prueba de hipótesis para rechazar o es aproximadamente inferior al 5%, debemos aceptarlos a ambos. O debemos rechazarlos a ambos.p H0 H1
De lo contrario, creamos doble estándar para la prueba de hipótesis aquí. No podemos aceptar la hipótesis de que el lanzamiento de la moneda es justo y que los datos del experimento se registran correctamente .
No tiene sentido decir que la moneda tiene una probabilidad p de cara
Tenemos el resultado del experimento para respaldar esta hipótesis.
Si el experimento se repite n veces, ¿es posible que tengamos el anterior de para el lanzamiento de la moneda como cuando n es considerablemente grande?p N(μ=0.5,σ2)
Si eso es aceptable, podemos estimar con un IC del 95% según el método de máxima probabilidad.σs
fuente