Usted observa k cabezas de n lanzamientos. ¿Es justa la moneda?

Me hicieron esta pregunta con en una entrevista. ¿Hay una respuesta "correcta"? $(n, k) = (400, 220)$

Suponga que los lanzamientos son iid y la probabilidad de caras es . La distribución de la cantidad de cabezas en 400 lanzamientos debe estar cerca de Normal (200, 10 ^ 2), de modo que 220 cabezas estén a 2 desviaciones estándar de la media. La probabilidad de observar dicho resultado (es decir, a más de 2 DE de la media en cualquier dirección) es ligeramente inferior al 5%. $p=0.5$

El entrevistador me dijo, esencialmente, "si observo algo> = 2 SD de la media, concluyo que está sucediendo algo más. Apostaría a que la moneda sea justa". Eso es razonable, después de todo, eso es lo que hacen la mayoría de las pruebas de hipótesis. ¿Pero es ese el final de la historia? Para el entrevistador esa parecía ser la respuesta "correcta". Lo que pregunto aquí es si algunos matices están justificados.

No pude evitar señalar que decidir que la moneda no es justa es una conclusión extraña en este contexto de lanzamiento de monedas. ¿Tengo razón al decir eso? Trataré de explicar a continuación.

En primer lugar, yo, y supongo que la mayoría de las personas también, tengo un fuerte historial con respecto a las monedas: es muy probable que sean justos. Por supuesto, eso depende de lo que entendamos por justo: una posibilidad sería definir "justo" como "tener una probabilidad de cabezas 'cercanas' a 0.5, digamos entre 0.49 y 0.51".

(También podría definir 'justo' como el significado de que la probabilidad de caras es exactamente 0.50, en cuyo caso ahora parece poco probable tener una moneda perfectamente justa ).

Su prioridad puede depender no solo de sus creencias generales sobre las monedas, sino también del contexto. Si sacó la moneda de su propio bolsillo, podría estar prácticamente seguro de que es justo; Si tu amigo mago lo sacó de él, tu prior podría poner más peso en las monedas de dos cabezas.

En cualquier caso, es fácil encontrar antecedentes razonables que (i) pongan una gran probabilidad de que la moneda sea justa y (ii) hagan que su posterior sea bastante similar, incluso después de observar 220 caras. Luego concluiría que es muy probable que la moneda sea justa, a pesar de observar un resultado 2 SD de la media.

De hecho, también podría construir ejemplos en los que observar 220 caras en 400 lanzamientos haga que su posterior ponga más peso en la moneda, por ejemplo, si todas las monedas injustas tienen una probabilidad de caras en . $\{0, 1\}$

¿Alguien puede arrojar algo de luz sobre esto por mí?

Después de escribir esta pregunta, recordé que había escuchado sobre esta situación general antes, ¿no es la "paradoja" de Lindley ?

Whuber puso un enlace muy interesante en los comentarios: puedes cargar un dado, pero no puedes sesgar una moneda . De la página 3:

No tiene sentido decir que la moneda tiene una probabilidad p de cara, porque puede determinarse completamente por la forma en que se la arroja, a menos que se lance en el aire con un giro rápido y quede atrapada en el aire con sin rebote, en cuyo caso p = 1/2.

¡Muy genial! Esto se relaciona con mi pregunta de una manera interesante: supongamos que sabemos que la moneda está "lanzada en el aire con un giro rápido y atrapada en el aire sin rebotar". Entonces definitivamente no deberíamos rechazar la hipótesis de que la moneda es justa (donde "justo" ahora significa "tener p = 1/2 cuando se lanza de la manera descrita anteriormente"), porque efectivamente tenemos un previo que pone toda la probabilidad en el La moneda es justa. Tal vez eso justifique hasta cierto punto por qué me incomoda rechazar el nulo después de observar 220 cabezas.

probability hypothesis-testing self-study prior Adrian
fuente

¿Cambiaría alguna parte de su pregunta si interpretara la "moneda" como una metáfora de algún proceso binario sobre el cual no tenía conocimiento previo?

whuber

@whuber Esa es una buena pregunta. Creo que en ese caso estaría mucho más dispuesto a ir con "rechazar cuando p <= 0.05", aunque no estoy muy seguro de cómo justificar eso ante mí mismo.

Adrian

Otra cuestión que me molesta es que la persona que hizo la pregunta estaba interesada en la hipótesis de que p = 0,50 exactamente. Pero si piensa que p se distribuye continuamente, tendrá probabilidad cero, independientemente de lo que observe. Me parece mucho más significativo hacer declaraciones sobre p perteneciente a algún intervalo. Este sería un problema en la situación en la que no tenía conocimiento previo y decidí usar un uniforme anterior, por ejemplo.

Adrian

Que tiene sentido. Sin embargo, la pregunta centrada en la moneda es un poco molesta, porque las respuestas a esas preguntas generalmente se convierten en discusiones sobre la física (y el juego de manos) del lanzamiento de monedas. Es posible que se sorprenda de lo contrario que puede ser la situación real a sus fuertes antecedentes, dependiendo de cómo se lance la moneda. "No tiene sentido decir que la moneda tiene una probabilidad de cara"

p

$p$ .

whuber

@Adrian DJC MacKay analiza este problema exacto (con n = 250, k = 140) en su libro de texto gratuito en este enlace: inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) Puede ser interesante lee lo que dice. Él llega a una conclusión similar a la tuya.

Flounderer

Respuestas:

La forma Bayesiana estándar de resolver este problema (sin aproximaciones normales) es declarar explícitamente su anterior, combinarlo con su probabilidad, que está distribuida en Beta. Luego integre su posterior alrededor del 50%, digamos dos desviaciones estándar o del 49% al 51% o lo que desee.

Si su creencia anterior es continua en [0,1], por ejemplo, Beta (100,100) (este pone mucha masa en monedas aproximadamente justas), entonces la probabilidad de que la moneda sea justa es cero ya que la probabilidad también es continua [0 , 1].

Incluso si la probabilidad de que la moneda sea justa es cero, generalmente puede responder cualquier pregunta que vaya a responder con el posterior sobre el sesgo. Por ejemplo, cuál es la ventaja del casino dada la distribución posterior sobre las probabilidades de monedas.

Neil G
fuente

+1, pero me gustaría complementar esta respuesta un poco. Supongamos que definimos una moneda justa como como sugiere el OP, y deseamos colocar el de nuestra probabilidad previa en este caso. Entonces, un previo razonable es , de modo queTeniendo en cuenta los datos de la pregunta, la distribución posterior se convierte en y la probabilidad posterior de una moneda equitativa sigue siendo muy grande:

0.49 < p < 0.51

$0.49 < p < 0.51$

99 %

$99\%$

p \sim Beta (8300, 8300)

$p \sim \text{Beta}(8300, 8300)$

P (p \in (0.49, 0.51)) = 0.99003.

$P(p \in (0.49, 0.51)) = 0.99003.$

p | data \sim Beta (8300 + 220, 8300 + 180)

$p|\text{data} \sim \text{Beta}(8300+220, 8300+180)$

P (p \in (0.49, 0.51) | data) = 0.9886.

$P(p \in (0.49, 0.51)|\text{data}) = 0.9886.$

knrumsey

Digamos para la distribución de Bernoulli, en este caso el lanzamiento de una moneda.

Claramente esta es una distribución binomial , y de hecho está cerca de . $B(n=400,p=0.5)$ $N(\mu=200,\sigma^2=100)$

Obviamente, el entrevistador está pidiendo el resultado de con un intervalo de confianza del con , o el valor de . $k$ $95\%$ $B(n=400,p=0.5)$ $p$ $B(n=400,p=0.5,k=220)$

En el enfoque bayesiano, su prioridad es que lugar de y $p=0.5$ $\pi(p=0.5)=0.5$ $\pi(p\neq0.5)=0.5$

otro antes más justo que y . Suponemos que tiene una distribución uniforme dentro de cada intervalo. $\pi(0.49\leq p\leq0.51)=0.9$ $\pi(p<0.49 \cup p>0.51)=0.1$ $p$

Entonces podemos calcular la posterior . $P(0.49\leq p\leq0.51|k=220)$

O es muy probable que lo anterior sea una distribución normal ~ , o podemos suponer una varianza mucho menor, como . $p$ $N(\mu=0.5,\sigma^2=0.25)$ $\sigma^2=0.1$

Luego calculamos la distribución posterior de como . $p$ $f(p|k=220)$

Mi reputación no es suficiente para escribir un comentario bajo la Pregunta. En cambio, voy a escribir algo aquí sobre No se puede sesgar una moneda . @Adrian

Esto es lo que tenemos.

El resultado del experimento $B(n=400,k=220,p=\theta)$
El estudio teórico y experimental No puedes sesgar una moneda

Aquí está nuestra hipótesis

$H_0:$ La moneda es justa, o $\hat\theta=0.5$

$H_1$ : los datos del experimento se registran incorrectamente

Aquí está nuestro resultado

Con base en el documento Usted puede cargar un dado, pero no puede sesgar una moneda , aceptamos la hipótesis . $H_0$
Según el resultado del experimento de que la diferencia es el doble de la desviación estándar, tenemos aproximadamente un nivel de confianza del 95% para aceptar la hipótesis , de que el estudio del experimento se registra erróneamente. $H_1$

Dado que el valor para la prueba de hipótesis para rechazar o es aproximadamente inferior al 5%, debemos aceptarlos a ambos. O debemos rechazarlos a ambos. $p$ $H_0$ $H_1$

De lo contrario, creamos doble estándar para la prueba de hipótesis aquí. No podemos aceptar la hipótesis de que el lanzamiento de la moneda es justo y que los datos del experimento se registran correctamente .

No tiene sentido decir que la moneda tiene una probabilidad p de cara

Tenemos el resultado del experimento para respaldar esta hipótesis.

Si el experimento se repite n veces, ¿es posible que tengamos el anterior de para el lanzamiento de la moneda como cuando n es considerablemente grande? $p$ $N(\mu=0.5,\sigma^2)$

Si eso es aceptable, podemos estimar con un IC del 95% según el método de máxima probabilidad. $\sigma^s$

Zhang Tschao
fuente

Gracias Zhang Una pequeña mordida: si quisieras usar la distribución Normal para tu anterior sobre la probabilidad de caras, diría que debes truncarla para que p se encuentre en [0, 1].

Adrian

Por supuesto, hay muchas distribuciones previas razonables y posteriores correspondientes. El punto real de mi pregunta es más general: decidir que la moneda no es justa me parece una conclusión extraña en este contexto de lanzamiento de monedas. ¿Qué opinas sobre eso y por qué?

Adrian

Un previo conveniente aquí sería la distribución Beta, ya que está conjugada con la probabilidad binomial. Pero, de nuevo, el verdadero objetivo de mi pregunta es más general que el previo específico.

Adrian

Creo que la razón es que le das demasiada probabilidad al específico anterior . Creo que si cambia lo anterior, es decir, una distribución simplemente uniforme , y construimos un intervalo de confianza del 95% para , creo que Encontrará que el resultado es muy convincente, con no se encuentra en el IC del 95% de . Y aceptamos fácilmente la hipótesis de que la moneda no es justa. Especialmente en este caso, no encontrará que decidir que la moneda no es justa sea una conclusión extraña.

π (p = 0.5)

$\pi(p=0.5)$

p \sim U (0, 1)

$p \sim U(0,1)$

E (p) \sim f (p | k = 220)

$E(p) \sim f(p|k=220)$

p = 0.5

$p=0.5$

E (p)

$E(p)$

Zhang Tschao

@ user777 La distribución normal aparece dos veces en la respuesta de Zhang, primero como una aproximación al binomio (grande), y segundo como un prior para la probabilidad de cabezas (cuando dice "lo anterior es una distribución normal p ~ N"). Zhang: su edición sobre que el Nulo es "la moneda es justa y los datos se registraron correctamente" es interesante, gracias por publicarla.

Adrian