(Disculpas de antemano por el uso de lenguaje laico en lugar de lenguaje estadístico).
Si quiero medir las probabilidades de tirar cada lado de un dado físico específico de seis lados dentro de aproximadamente +/- 2% con una confianza razonable de certeza, ¿cuántas muestras de tiradas serían necesarias?
es decir, ¿cuántas veces necesitaría tirar un dado, contando cada resultado, para estar 98% seguro de que las posibilidades de que arroje cada lado están dentro del 14.6% - 18.7%? (O algunos criterios similares en los que uno estaría aproximadamente 98% seguro de que el dado es justo dentro del 2%).
(Esta es una preocupación del mundo real para los juegos de simulación que usan dados y quieren asegurarse de que ciertos diseños de dados tengan una probabilidad aceptable de 1/6 de lanzar cada número. Hay afirmaciones de que muchos diseños de dados comunes se han medido lanzando 29% de 1 por tirar varios dados 1000 veces cada uno.)
fuente
Respuestas:
TL; DR: sip = 1/6 y desea saber qué tan grande n necesita estar 98% seguro de que los dados son justos (dentro del 2%), n debe ser al menos n ≥ 766 .
Sean el número de rollos y X el número de rollos que aterrizan en algún lado especificado. Entonces X sigue una distribución Binomial (n, p) donde p es la probabilidad de obtener ese lado especificado.
Por el teorema del límite central, sabemos que
Dado queX/n es la media muestral de n variables aleatorias de Bernoulli (p) . Por lo tanto, para n grande , los intervalos de confianza para p pueden construirse como
Puesto quep es desconocida, podemos sustituirla por la muestra media p = X / n , y por diversos teoremas de convergencia, sabemos que el intervalo de confianza resultante será asintóticamente válida. Entonces obtenemos intervalos de confianza de la formap^=X/n
con p = X / n . Voy a suponer que sabes lo que son las puntuaciones Z. Por ejemplo, si desea un intervalo de confianza del 95%, toma Z = 1.96 . Entonces, para un nivel de confianza dado α tenemosp^=X/n Z Z=1.96 α
Ahora supongamos que desea que este intervalo de confianza tenga una longitud menor queCα , y desea saber qué tan grande es la muestra que necesitamos para hacer este caso. Bueno, esto equivale a preguntar qué satisface nα
Que luego se resuelve para obtener
Así tapón en sus valores paraZα , Cα , y se estima p para obtener una estimación de n α . Tenga en cuenta que dado que p es desconocido, esto es solo una estimación, pero asintóticamente (a medida que n aumenta) debería ser preciso.p^ nα p n
fuente