¿Debo usar un CDM binomial o un CDF normal al lanzar monedas?

11

Una moneda necesita ser probada para ser justa. 30 cabezas salen después de 50 vueltas. Suponiendo que la moneda es justa, ¿cuál es la probabilidad de que obtenga al menos 30 caras en 50 lanzamientos?

La forma correcta de resolver este problema, según mi maestro, es hacerlo

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Sin embargo, tomé una función de distribución acumulativa binomial como esta

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Creo que se cumplen los criterios para una distribución binomial: los eventos individuales son independientes, solo hay dos resultados posibles (cara versus cruz), la probabilidad es constante para la pregunta (0.5) y el número de ensayos se fija en 50 Sin embargo, obviamente, los dos métodos dan respuestas diferentes, y una simulación respalda mi respuesta (al menos las pocas veces que la ejecuté; obviamente, no puedo garantizar que obtenga los mismos resultados).

¿Se equivoca mi maestro al suponer que una curva de distribución Normal también sería una forma válida de resolver este problema (en ningún momento se dice que la distribución es Normal, pero n * p y n * (1-p) son mayores que 10), ¿o he entendido mal algo sobre las distribuciones binomiales?

waiwai933
fuente
55
Una persona con experiencia en el uso de aproximaciones normales al Binomial procedería de manera un poco diferente: aplicarían la corrección de continuidad (habitual) , como en 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(esta es una expresión R), cuyo valor es 0.1015, muy de acuerdo con el CDM Binomial .
whuber

Respuestas:

10

Aquí hay una ilustración de las respuestas de whuber y onestop.

corrección de continuidad

En rojo, la distribución binomial , en negro la densidad de la aproximación normal , y en azul la superficie correspondiente a para .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

La altura de una barra roja correspondiente a para está bien aproximada por . Para obtener una buena aproximación de , debe usar .P(X=k)XBin(50,0.5)P(k12<Y<k+12)P(X30)P(Y>29.5)

(editar) Esto es (obtenido en R por ) mientras que la aproximación es correcta.

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

Esto se llama corrección de continuidad . Le permite calcular incluso "probabilidades de punto" como : P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.
Elvis
fuente
4

La distribución normal da una aproximación más cercana al binomio si usa una corrección de continuidad . Usando esto para su ejemplo, obtengo 0.1015. Como esto es tarea, te lo dejo para que completes los detalles.

una parada
fuente
4

Considera esto. En la distribución binomial discreta tienes probabilidades reales de números individuales. En la normal continua que no es el caso, necesita un rango de valores. Entonces ... si fuera a aproximar la probabilidad de un valor individual, digamos X, desde el binomio con el normal, ¿cómo haría eso? Mire un histograma de probabilidad de la distribución binomial con la curva normal sobre él. Debería seleccionar realmente de X ± 0.5 para capturar algo similar a lo que es la probabilidad binomial de X con la aproximación normal.

Ahora extiéndalo a cuando seleccione una cola de la distribución. Cuando usa el método binomial, está seleccionando la probabilidad de su valor completo (30 en su caso) más todo lo más alto. Por lo tanto, cuando haces el continuo, debes asegurarte de capturar eso y seleccionar 0.5 menos, así que el límite en la distribución continua es 29.5.

John
fuente
3
En realidad, la pregunta muestra una comprensión reflexiva del problema y no parece estar buscando una respuesta a una pregunta de tarea de rutina. Aunque es tarea marcada , considere hacer una excepción aquí. En particular, una buena discusión sobre el uso de la distribución Normal para aproximar distribuciones discretas (como Binomials y Poissons con N grandes) sería apropiada y muy bienvenida aquí.
whuber