¿Cómo puedo probar la equidad de un dado de veinte lados (d20)? Obviamente estaría comparando la distribución de valores con una distribución uniforme. Recuerdo vagamente usar una prueba de Chi-cuadrado en la universidad. ¿Cómo puedo aplicar esto para ver si un dado es justo?
29
Respuestas:
Aquí hay un ejemplo con código R. La salida está precedida por # 's. Un dado justo:
Un dado sesgado: los números del 1 al 10 tienen una probabilidad de 0.045; esos 11-20 tienen una probabilidad de 0.055 - 200 tiros:
Tenemos evidencia insuficiente de sesgo (p = 0,64).
Un dado sesgado, 1000 lanzamientos:
Ahora p <0.05 y estamos comenzando a ver evidencia de sesgo. Puede usar simulaciones similares para estimar el nivel de sesgo que puede esperar detectar y la cantidad de lanzamientos necesarios para detectarlo con un nivel p dado.
Wow, otras 2 respuestas incluso antes de que termine de escribir.
fuente
¿Quieres hacerlo a mano o en Excel?
Si quieres hacerlo en R , puedes hacerlo de esta manera:
Paso 1: tira tu dado (digamos) 100 veces.
Paso 2: cuenta cuántas veces obtuviste cada uno de tus números
Paso 3: colóquelos en R de esta manera (escriba la cantidad de veces que obtuvo cada dado, en lugar de los números que escribí):
Paso 4: simplemente ejecuta este comando:
Si el valor P es bajo (p. Ej., Debajo de 0.05), su dado no está equilibrado.
Este comando simula un dado equilibrado (P = ~ .5):
Y esto simula un dado desequilibrado:
(Se trata de P = ~ .005)
Ahora la verdadera pregunta es cuántos dados se deben tirar a qué nivel de poder de detección. Si alguien quiere resolver eso, es bienvenido ...
Actualización: También hay un buen artículo sobre este tema aquí .
fuente
Primero, en línea con lo que dijo @Glen_b, un bayesiano no está realmente interesado en si el dado es exactamente justo o no, no lo es. Lo que le importa es si está lo suficientemente cerca , sea lo que sea "suficiente" en el contexto, digamos, dentro del 5% de lo justo para cada lado.
De todos modos, así es como (con R):
Primero, obtenga algunos datos. Tiramos el dado 500 veces.
(Estamos comenzando con un dado justo; en la práctica, estos datos serían observados).
Finalmente, calculemos nuestra probabilidad posterior (después de observar los datos) de que el dado está dentro de 0.05 de justo en cada coordenada.
El resultado es aproximadamente 0.9486 en mi máquina. (Realmente no es una sorpresa. Después de todo, comenzamos con un dado justo).
Comentario rápido: probablemente no es razonable para nosotros haber usado un previo no informativo en este ejemplo. Dado que incluso hay una pregunta, presumiblemente, el dado parece aproximadamente equilibrado en primer lugar, por lo que puede ser mejor elegir un prior que se concentre más cerca de 1/3 en todas las coordenadas. Por encima de esto, simplemente habría aumentado aún más nuestra probabilidad posterior estimada de "casi justo".
fuente
Una prueba de bondad de ajuste chi-cuadrado tiene como objetivo encontrar todos los tipos posibles de desviaciones de la estricta uniformidad. Esto es razonable con un d4 o un d6, pero con un d20, es probable que esté más interesado en verificar que la probabilidad de obtener (o posiblemente superar) cada resultado esté cerca de lo que debería ser.
A lo que me estoy refiriendo es que hay algunos tipos de desviaciones de la equidad que afectarán en gran medida lo que sea que esté usando un d20 y otros tipos de desviaciones que apenas importan, y la prueba de chi-cuadrado dividirá el poder entre más interesantes y alternativas menos interesantes. La consecuencia es que para tener suficiente poder para detectar incluso desviaciones bastante moderadas de la equidad, necesita una gran cantidad de rollos, mucho más de lo que alguna vez desearía sentarse y generar.
(Sugerencia: invente algunos conjuntos de probabilidades no uniformes para su d20 que tendrán un mayor impacto en el resultado para el que está usando el d20 y use la simulación y las pruebas de chi-cuadrado para averiguar qué poder tiene contra ellos varios números de rollos, para que tenga una idea de la cantidad de rollos que necesitará).
Hay una variedad de formas de verificar las desviaciones "interesantes" (las que serán más propensas a afectar sustancialmente los usos típicos de un d20)
Mi recomendación es hacer una prueba de ECDF (prueba de tipo Kolmogorov-Smirnov / Anderson-Darling, pero es probable que desee ajustar la conservaduría que resulta de la distribución discreta, al menos levantando el nivel alfa nominal, pero incluso mejor simplemente simulando la distribución para ver cómo va la distribución de la estadística de prueba para un d20).
Estos todavía pueden detectar cualquier tipo de desviación, pero ponen relativamente más peso en los tipos más importantes de desviación.
Un enfoque aún más poderoso es construir específicamente una estadística de prueba que sea específicamente sensible a las alternativas más importantes para usted, pero implica un poco más de trabajo.
En esta respuesta sugiero un método gráfico para probar un dado basado en el tamaño de las desviaciones individuales. Al igual que la prueba de chi-cuadrado, esto tiene más sentido para dados con pocos lados como d4 o d6.
fuente
Si está interesado en verificar la cantidad de veces que aparece cada número, entonces una prueba de Chi-cuadrado sería adecuada. Supongamos que lanzas un dado N veces. Es de esperar que cada valor aparezca N / 20 veces. Todo lo que hace una prueba de chi-cuadrado es comparar lo que observaste con lo que obtienes. Si esta diferencia es demasiado grande, esto indicaría un problema.
Otras pruebas
Si estaba interesado en otros aspectos de la randonness, por ejemplo, si dados dio el siguiente resultado:
Entonces, aunque esta salida tiene el número correcto de cada valor individual, claramente no es aleatorio. En este caso, eche un vistazo a esta pregunta . Esto probablemente solo tiene sentido para los dados electrónicos.
Prueba de Chi-cuadrado en R
En R, esto sería
fuente
Quizás uno no debería enfocarse tanto en un conjunto de rollos.
Intenta lanzar un dado de 6 lados 10 veces y repite el proceso 8 veces.
Puede verificar que la suma de cada repetición sume a 10.
Para cada repetición (en columnas) puede calcular la bondad de ajuste utilizando la prueba Chi ^ 2.
Cuantos más lanzamientos hagas, menos sesgado verás. Hagamos esto para un gran número.
fuente