¿Cuántas veces debo tirar un dado para evaluar con seguridad su imparcialidad?

22

(Disculpas de antemano por el uso de lenguaje laico en lugar de lenguaje estadístico).

Si quiero medir las probabilidades de tirar cada lado de un dado físico específico de seis lados dentro de aproximadamente +/- 2% con una confianza razonable de certeza, ¿cuántas muestras de tiradas serían necesarias?

es decir, ¿cuántas veces necesitaría tirar un dado, contando cada resultado, para estar 98% seguro de que las posibilidades de que arroje cada lado están dentro del 14.6% - 18.7%? (O algunos criterios similares en los que uno estaría aproximadamente 98% seguro de que el dado es justo dentro del 2%).

(Esta es una preocupación del mundo real para los juegos de simulación que usan dados y quieren asegurarse de que ciertos diseños de dados tengan una probabilidad aceptable de 1/6 de lanzar cada número. Hay afirmaciones de que muchos diseños de dados comunes se han medido lanzando 29% de 1 por tirar varios dados 1000 veces cada uno.)

Dronz
fuente
1
Esto es mucho más complicado que encontrar el intervalo de confianza para un binomio, ya que querrás mantener todas las probabilidades bajo control. Eche un vistazo al artículo de Hsiuying Wang sobre intervalos de confianza simultáneos para distribuciones multinomiales ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). Puede encontrar algo de código en esta publicación de blog , que también ofrece un resumen rápido sobre algunos de los trabajos realizados al respecto.
idnavid
1
Tenga en cuenta que si solo está interesado en verificar si los 1 se obtienen una buena cantidad de tiempo, esto simplifica mucho la pregunta.
Dennis Jaheruddin
2
Es importante tener en cuenta que el "intervalo de confianza" no le brinda una "probabilidad porcentual de ser correcto". Sospecho que está utilizando el uso común muy razonable del término "98% seguro", pero debe saberlo cada vez que alguien menciona "intervalo de confianza" que no es lo mismo que un 98% de probabilidad: link.springer.com/ artículo / 10.3758% 2Fs13423-013-0572-3
BrianH
1
@BrianH ¡Gracias! No solo quise decir la expresión coloquial, sino que estoy tratando de cuantificar la certeza implícita en la prueba. Me parece que, de la misma manera que tiene sentido decir que espero tirar algún resultado de dado un porcentaje calculable del tiempo, habría un cálculo similar (pero más complejo) para la probabilidad de tirar resultados dentro de cierto margen de error en la lista n veces, que es lo que creo que entiendo que dice la respuesta de Xiamoi (y el comentario de seguimiento) ¿Sí?
Dronz
1
@Dronz Para ser justos, esta es una de esas cosas que realmente crees que sería más directa de lo que parece ser. Demoniacamente complicado, de hecho. Aquí hay algunas preguntas clave relacionadas en otros lugares para ayudarlo a tener una idea de cómo no hay una respuesta increíblemente directa: Frequentist math.stackexchange.com/questions/1578932/… Bayesian math.stackexchange.com/questions/1584833/… y diversión: rpg.stackexchange.com/questions/70802/…
BrianH

Respuestas:

18

TL; DR: si p = 1/6 y desea saber qué tan grande n necesita estar 98% seguro de que los dados son justos (dentro del 2%), n debe ser al menos n ≥ 766 .


Sea n el número de rollos y X el número de rollos que aterrizan en algún lado especificado. Entonces X sigue una distribución Binomial (n, p) donde p es la probabilidad de obtener ese lado especificado.

Por el teorema del límite central, sabemos que

n(X/np)N(0,p(1p))

Dado que X/n es la media muestral de n variables aleatorias de Bernoulli (p) . Por lo tanto, para n grande , los intervalos de confianza para p pueden construirse como

Xn±Zp(1p)n

Puesto que p es desconocida, podemos sustituirla por la muestra media p = X / n , y por diversos teoremas de convergencia, sabemos que el intervalo de confianza resultante será asintóticamente válida. Entonces obtenemos intervalos de confianza de la formap^=X/n

p^±Zp^(1p^)n

con p = X / n . Voy a suponer que sabes lo que son las puntuaciones Z. Por ejemplo, si desea un intervalo de confianza del 95%, toma Z = 1.96 . Entonces, para un nivel de confianza dado α tenemosp^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Ahora supongamos que desea que este intervalo de confianza tenga una longitud menor que Cα , y desea saber qué tan grande es la muestra que necesitamos para hacer este caso. Bueno, esto equivale a preguntar qué satisface nα

Zαp^(1p^)nαCα2

Que luego se resuelve para obtener

nα(2ZαCα)2p^(1p^)

Así tapón en sus valores para Zα , Cα , y se estima p para obtener una estimación de n α . Tenga en cuenta que dado que p es desconocido, esto es solo una estimación, pero asintóticamente (a medida que n aumenta) debería ser preciso.p^nαpn

Xiaomi
fuente
3
Gracias. Como no he hecho matemáticas de tipo universitario en décadas, ¿podría molestarte para que ingreses los números y realmente me des un número aproximado de veces que necesitaría lanzar un dado, como un número entero?
Dronz
99
p=1/6nnn766Cα
44
Puede ser más interesante observar la distribución multinomial, ya que ahora probamos cada lado por separado. Esto no tiene en cuenta toda la información que tenemos sobre el problema. Para una explicación intuitiva, mire stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
enero
55
Estoy de acuerdo con @Jan: esta respuesta no responde a la pregunta. Además, no se puede adaptar fácilmente para construir una respuesta aplicándola por separado a las seis caras, porque las seis pruebas son interdependientes.
whuber
3
Esta es una buena respuesta, pero estoy totalmente de acuerdo con @Jan, whuber. Esta pregunta merece una respuesta basada en estadística de chi-cuadrado y distribución multinomial.
Łukasz Grad