¿Cómo evaluar si una moneda lanzada 900 veces y sale cara 490 veces está sesgada?

9

Se arroja una moneda 900 veces y las cabezas aparecieron 490 veces. ¿El resultado apoya la hipótesis de que la moneda es imparcial?

hypothesis-testing self-study statistical-significance binomial Sanu
fuente

3

Hipótesis nula: la moneda es imparcial. Alternativa, difícil de conocer, posiblemente la probabilidad simétrica de una cabeza es

\neq 1 / 2

$\ne 1/2$ . Nivel de significación: usted decide. Si se cumple la hipótesis nula, entonces el número de cabezas tiene una distribución casi normal, desviación estándar

\sqrt{(900) (1 / 2) (1 / 2)} = 15

$\sqrt{(900)(1/2)(1/2)}=15$ . Ahora

490

$490$ es sobre

2.66

$2.66$ unidades de desviación estándar de la media (

450

$450$ ) si se cumple la hipótesis nula. De las tablas de normal normal o de otro tipo, esto tiene una probabilidad de

0.0078

$0.0078$ . Entonces en el

1

$1$ % de significancia, rechazamos la hipótesis nula.

1

Es posible que desee echar un vistazo a las pruebas de hipoteca

77

Para referencia futura: se recomienda encarecidamente hacer cruces de copias de su pregunta en varios sitios de SE . Esto sucede comúnmente con los nuevos usuarios que no están familiarizados con esta política, por lo que no se sienta mal. Solo, por favor, tenlo en cuenta. Bienvenido al sitio.

cardenal

Esta pregunta, que puede ser exactamente lo que dice el problema de tarea de OP Sanu o puede ser la paráfrasis de Sanu de la pregunta realmente formulada, dice "¿El resultado respalda la hipótesis de que la moneda es imparcial?" Todas las respuestas toman la hipótesis nula para ser

P (Heads) = 0.5

$P(\text{Heads}) = 0.5$ . Mi pregunta es: ¿alguna vez las observaciones respaldan la hipótesis nula? Incluso si la moneda cayera cara

450

$450$ tiempos fuera de

900

$900$ , eso no es compatible con la hipótesis nula; solo evidencia muy débil que apoya el rechazo de la nula. La evidencia siempre está a favor del rechazo de lo nulo, nunca en apoyo de lo nulo.

Dilip Sarwate

@Dilip: si relees la respuesta de Greg, verás que tu comentario anterior no es del todo cierto. Una prueba de equivalencia (o, a menudo, bioequivalencia) tiene una alternativa que es una versión ligeramente "difusa" de la hipótesis deseada para la que se quiere evidencia. Creo que verá de inmediato por qué tenemos que permitir un poco más de margen de maniobra de lo que realmente nos gustaría.

cardenal

16

Aquí la hipótesis nula natural $H_0$ es que la moneda es imparcial, es decir, que la probabilidad $p$ de una cabeza es igual a $1/2$ . La hipótesis alternativa más razonable $H_1$ es eso $p\ne 1/2$ , aunque uno podría defender la hipótesis alternativa unilateral $p>1/2$ .

Necesitamos elegir el nivel de significación de la prueba. Eso depende de usted. Dos números tradicionales son $5$ % y $1$ %

Supongamos que se cumple la hipótesis nula. Entonces el número de cabezas tiene * distribución binomial con media $(900)(1/2)=450$ y desviación estándar $\sqrt{(900)(1/2)(1/2)}=15$ .

La probabilidad de que al lanzar una moneda justa el número de caras difiera de $450$ por $40$ o más (en cualquier dirección) es, por simetría, Esto no es práctico para calcular a mano, pero Wolfram Alpha da una respuesta de aproximadamente .

2 \sum_{k = 490}^{900} (\binom{900}{k}) {(\frac{1}{2})}^{900} .

$2\sum_{k=490}^{900} \binom{900}{k}\left(\frac{1}{2}\right)^{900}.$

0.008419

$0.008419$

Por lo tanto, si la moneda no era imparcial, sería bastante improbable una cantidad de caras que difieren de por o más. Tendría una probabilidad inferior al %. entonces al nivel de significancia del %, rechazamos la hipótesis nula. $450$ $40$ $1$ $1$

También podemos usar la aproximación normal al binomio para estimar la probabilidad de que el número de cabezas sea o bajo la hipótesis nula . Nuestra normal tiene una media de y la varianza es con probabilidad la probabilidad de que una normal estándar sea . De las tablas para lo normal, esto es aproximadamente . Doble para tener en cuenta la cola izquierda. Obtenemos aproximadamente , bastante cerca del valor dado por Wolfram Alpha, y menos del \%. Entonces si usamos $\ge 490$ $\le 410$ $p=1/2$ $450$ $15$ $\ge 490$ $\ge 40/15$ $0.0039$ $0.0078$ $1$ $1$ \% como nuestro nivel de significancia, nuevamente rechazamos la hipótesis nula . $H_0$

Comentarios: . En la aproximación normal al binomio, obtenemos una mejor aproximación a la probabilidad de que el binomio sea calculando la probabilidad de que lo normal sea . Si desea buscarlo, esta es la corrección de continuidad . Si usamos la aproximación normal con corrección de continuidad, encontramos que la probabilidad de o más o o menos cabezas es de aproximadamente , bastante cerca de la respuesta "exacta" proporcionada por Wolfram Alpha. Por lo tanto, podemos encontrar una estimación muy precisa, como en los viejos tiempos, usando tablas de la norma normal y haciendo la aritmética "a mano". $1$ $\ge 490$ $\ge 489.5$ $490$ $410$ $0.008468$

$2$ . Supongamos que usamos la hipótesis alternativa algo menos natural . Si , la probabilidad de o más es de aproximadamente . Por lo tanto, nuevamente al nivel de significancia del %, rechazaríamos la hipótesis nula, de hecho la rechazaríamos incluso si estuviéramos usando el nivel de significancia . $p>1/2$ $p=1/2$ $490$ $0.00421$ $1$ $0.005$

Siempre es necesario establecer un nivel de significancia, ya que es posible que una moneda justa rinda, digamos, o más caras en lanzamientos, lo cual es ridículamente improbable. $550$ $900$

fuente

2

Esta pregunta fue marcada como tarea. En tales casos, se desaconseja dar una respuesta completa y autónoma que no deje trabajo a la persona que pregunta.

Macro

1

Esta fue una respuesta de math.SE que se fusionó con la pregunta y es autor de un usuario de muy alta reputación en mates.SE. La pregunta no fue etiquetada como tarea allí en ese momento.

cardenal

No entiendo muy bien la lógica de "Por lo tanto, si la moneda fuera imparcial, una cantidad de caras que difiere de 450 por 40 o más sería bastante improbable". ¿Por qué necesitaríamos calcular la probabilidad de 40 or more, pero no 40 or lesso simplemente 40?

una oferta no puede rechazar el

y, por lo tanto, la respuesta de @Marco tiene menos `` me gusta '' y muchos más comentarios derivados de las confusiones: p

Evan Pu

8

Si la moneda es imparcial, entonces la probabilidad de 'cara' es . Por lo tanto, el número de caras lanzadas en 900 intentos, , tiene una distribución bajo la hipótesis nula de una moneda justa. Entonces, el valor - la probabilidad de ver un resultado tan extremo o más extremo dado que la moneda está lejos, es $\frac{1}{2}$ $X$ ${\rm Binomial}(900,\frac{1}{2})$ $p$

P (X \geq 490)

$P( X \geq 490 )$

Si busca el valor 2 lados , sería $p$

1 - P (410 < X < 490)

$1 - P(410 < X < 490 )$

Te lo dejo a ti para describir por qué ese es el caso.

Sabemos que la función de masa para , es $Y \sim {\rm Binomial}(n,p)$

P (Y = y) = (\binom{n}{y}) p^{y} (1 - p)^{n - y}

$P(Y = y) = \binom{n}{y} p^y (1-p)^{n-y}$

Te lo dejo a ti para calcular el valor que buscas. $p$

Nota: El tamaño de la muestra aquí es lo suficientemente grande como para que pueda usar la aproximación normal a la distribución binomial. He detallado anteriormente cómo calcular el valor exacto . $p$

Macro
fuente

¿Debería calcularse el valor para una prueba a dos caras o una prueba a una cara?

p

$p$

Dilip Sarwate

1

Me imagino de dos caras, ya que la pregunta solo buscaba determinar si la moneda era imparcial o no. Es decir, parece que . Pero, no está claro si lo que está escrito arriba es la pregunta literal o una paráfrasis.

H_{a} : p \neq 1 / 2

$H_{a}: p \neq 1/2$

Macro

1

Entonces, en este caso, y posiblemente en muchos otros, la simetría implica que el valor dos lados es exactamente el doble del valor un solo lado . El valor unilateral es menor que mientras que el valor bilateral es mayor. Por lo tanto, el valor nulo debe rechazarse en el nivel (lo sé, no en los niveles y más comúnmente usados ) si estamos usando una prueba unilateral y no rechazada si estamos usando un doble. prueba. ¿Es esto correcto?

p

$p$

p

$p$

p

$p$

0.005

$0.005$

p

$p$

0.5 %

$0.5\%$

5 %

$5\%$

1 %

$1\%$

Dilip Sarwate

1

Sí, si estaba haciendo la prueba con el nivel , entonces rechazaría la prueba unilateral y no la prueba bilateral. Sin embargo, si uno hace o no una prueba de 1 o 2 lados, debe elegirse a priori, según la pregunta de investigación, por lo que este problema no debería surgir en la práctica.

α = .005

$\alpha=.005$

Macro

"Si una prueba de 1 cara o de 2 caras debe elegirse a priori o no" es válida, pero ¿qué sucede si no se ha hecho la elección? ¿Debería decirse a OP Sanu que los datos experimentales respaldan la hipótesis de que la moneda es imparcial en el nivel (nulo no es rechazado por la prueba de dos lados) pero también respalda la hipótesis de que en el nivel (nulo es rechazado por una prueba unilateral)?

0.5 %

$0.5\%$

P (Heads) > \frac{1}{2}

$P(\text{Heads}) > \frac{1}{2}$

0.5 %

$0.5\%$

Dilip Sarwate

4

El ejemplo de la página de Wikipedia sobre el factor Bayes parece bastante relevante para la pregunta. Si tenemos dos modelos, M1 donde la moneda es exactamente imparcial (q = 0.5) y M2 donde se desconoce la probabilidad de una cara, entonces usamos una distribución previa plana en 1. Luego calculamos el factor bayes

$K = \frac{p(x=490|M_0)}{p(x=490|M_1)}$

dónde

$p(x=490|M1) = \mathrm{nchoosek}(900,490)\frac12^{900} = 7.5896\times10^{-4}$

y

$p(x=490|M2) = \int_0^1 \mathrm{nchoosek}(900,490)q^{490}(1-q)^{410}dq = \frac{1}{901}$

Da un factor de Bayes de , que según la escala habitual de interpretación "apenas vale la pena mencionar". $K \approx 1.4624$

Sin embargo, tenga en cuenta que (i) el factor Bayes tiene una penalización occam incorporada que favorece los modelos simples, y M1 es mucho más simple ya que no tiene parámetros molestos, mientras que M2 sí; (ii) un plano anterior en no es físicamente razonable, en la práctica una moneda sesgada estará cerca de ser justa a menos que la moneda sea obviamente asimétrica; (iii) ha sido un día largo y fácilmente podría haber cometido un error en alguna parte del análisis, desde suposiciones hasta cálculos. $q$

Tenga en cuenta que la moneda está sesgada si es un objeto físico, ya que su asimetría significa que no será tan probable que caiga cara como cruz.

Dikran Marsupial
fuente

3

Su pregunta podría abordarse de diferentes maneras.

La prueba tradicional de hipótesis está diseñada para descartar posibilidades, no necesariamente probarlas. En este caso, podemos usar como la hipótesis nula y ver si los datos (490 de 900 cabezas) pueden usarse para rechazar esta hipótesis nula calculando un valor p. Si el valor p es menor que , rechazamos el valor nulo, pero un valor p no significa que podamos decir que los datos son compatibles con el valor nulo, solo que es consistente con el supuesto de que el valor nulo es verdadero , pero en realidad el valor nulo podría ser falso, solo la verdad es un valor de muy cercano a . $H_0: p=0.5$ $\alpha$ $>\alpha$ $p$ $0.5$

El enfoque de "equivalencia" sería definir imparcial no como sino elegir una pequeña región alrededor de 0.5 para considerar como imparcial . Entonces, si el intervalo de confianza en la proporción verdadera se encuentra completamente dentro del intervalo de equivalencia de "imparcial", entonces los datos apoyarían la hipótesis de "imparcialidad". $p=0.5$ $0.5-\epsilon < p < 0.5+\epsilon$

Otro enfoque sería utilizar un enfoque bayesiano donde comenzamos con una distribución previa de la verdadera proporción incluye una masa puntual de 0,5 y el resto de la probabilidad se distribuye entre los posibles valores. Luego combine eso con los datos para obtener un posterior. Si la probabilidad de posterioun de es lo suficientemente alta, entonces eso respaldaría la afirmación de ser imparcial. $p$ $p=0.5$

Greg Snow
fuente

Tenga en cuenta que a menudo el enfoque bayesiano dará como resultado posteriores continuos y, por lo tanto, la probabilidad posterior de exactamente es a menudo 0. La pregunta más interesante es entonces cuál es la diferencia entre nuestra estimación posterior de .5.

p = 0.5

$p = 0.5$

Michael McGowan

2

@MichaelMcGowan: si uno comienza con una masa de punto anterior en también habrá una masa de punto posterior. Si esto tiene sentido o no, depende del problema ...

p = 0.5

$p=0.5$

Xi'an

2

Y una ilustración R:

Sin molestarnos en aproximarnos por lo normal, podemos observar una variable aleatoria distribuida binomial con n = 900 y p = 0.5 bajo la hipótesis nula (es decir, si la moneda fuera imparcial, entonces p = probabilidad de caras (o colas) = 0.5).

Si quisiéramos probar la alternativa de que Ha: p <> 0.5 en alfa 0.05 podemos ver las colas de la distribución debajo de la nula de la siguiente manera y ver que 490 queda fuera del intervalo {421, 479} y por lo tanto rechazamos Ho .

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479

B_Miner
fuente

1

Para aclarar el enfoque bayesiano:

Empiezas por no saber nada, excepto que eso P(Heads)está adentro [0,1]. Entonces comience con una entropía máxima antes -> uniform(0,1). Esto se puede representar como una distribución beta -> beta(1,1).

Cada vez que lance la moneda, actualice Bayesian de la moneda P(Heads)multiplicando cada punto en la distribución por su probabilidad (multiplique por xsi lanza caras , multiplique por (1-x)si obtiene colas) y vuelva a normalizar la probabilidad total a 1 Esto es lo que hace la distribución beta, por lo que si el primer rollo es cara, tendrás beta(2,1). En tu caso tienes beta(490,510).

A partir de ahí, calcularía el intervalo de probabilidad del 95%, y si 0.5 no está en ese intervalo, comenzaría a sospechar.

La primera vez que realicé este ejercicio, me sorprendió mucho el tiempo que tardó en converger ... Empecé porque alguien dijo "si lanzas una moneda 100 veces, sabes P(Heads)que +/- 1%" resulta ser totalmente equivocado, necesitas magnitudes de más de 100 vueltas.

mdaoust
fuente

0

Hipótesis nula, Ho: P = 0.5 (P = Q = 0.5)

H1: P> 0.5

donde P es el problema de la cabeza que ocurre.

sabemos z = (pP) / sqrt (PQ / N)

donde p = 490/900 = 0.54

Ahora z = (0.54-0.5) / sqrt ((0.5 * 0.5) / 900)

z = 2

por lo tanto al 5% LOS (es decir, 1.64 <2) Ho es rechazado

por lo tanto, la moneda está sesgada .....

Mithun Krishnan k
fuente

1

¡Bienvenido a nuestro sitio! ¿Leíste las otras respuestas antes de responder? Puede disfrutar de los análisis reflexivos contenidos en varios de ellos. Incluyen los mismos cálculos, por lo que me pregunto qué parte de su respuesta o su forma de presentación representa algo más nuevo o mejor que lo que ya se ha publicado.

whuber

¿Cómo evaluar si una moneda lanzada 900 veces y sale cara 490 veces está sesgada?

Respuestas: