Supongamos que observa la secuencia:
7, 9, 0, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 2, 8. ..
¿Qué pruebas estadísticas aplicarías para determinar si esto es realmente aleatorio? FYI estos son los º dígitos de π . Entonces, ¿los dígitos de π son estadísticamente aleatorios? ¿Esto dice algo sobre la constante π ?
random-generation
randomness
Cam.Davidson.Pilon
fuente
fuente
Respuestas:
El Instituto Nacional de Normas de EE. UU. Ha reunido una batería de pruebas que un generador de números (pseudo-) aleatorio debe pasar para ser considerado adecuado, consulte http://csrc.nist.gov/groups/ST/toolkit/rng/stats_tests. html . También hay pruebas conocidas como el conjunto de pruebas Diehard , que se superponen un poco con las pruebas NIST. Los desarrolladores del paquete estadístico Stata informan sus resultados Diehard como parte de su proceso de certificación. Me imagino que puedes tomar bloques de dígitos de , digamos en grupos de 15 dígitos consecutivos, para que sean comparables a losπ precisión de doble tipo , y ejecutar estas baterías de pruebas en números así obtenidos.
fuente
Respondiendo solo la primera de tus preguntas: "¿Qué pruebas aplicarías para determinar si esta [secuencia] es verdaderamente aleatoria?"
¿Qué tal si lo tratamos como una serie temporal y si buscamos correlaciones automáticas? Aquí hay un código R. Primero algunos datos de prueba (primeros 1000 dígitos):
Verifique los recuentos de cada dígito:
Luego conviértalo en una serie temporal y ejecute la prueba Box-Pierce:
que me dice
Por lo general, desearía que el valor p sea inferior a 0.05 para decir que hay correlaciones automáticas.
Ejecute
acf(d)
para ver las correlaciones automáticas. No he incluido una imagen aquí, ya que es un gráfico aburrido, aunque es curioso que los retrasos más grandes sean a las 11 y 22. Ejecutaracf(d,lag.max=40)
para mostrar que no hay pico en el retraso = 33, y que fue solo una coincidencia!PD: Podríamos comparar qué tan bien lo hicieron esos 1000 dígitos de pi, haciendo las mismas pruebas en números aleatorios reales.
Esto genera 1000 dígitos aleatorios, realiza la prueba y repite esto 100 veces.
Entonces, nuestro resultado fue cómodamente dentro de la primera desviación estándar, y pi grazna como un pato al azar. (Solía
set.seed(1)
si quieres reproducir esos números exactos).fuente
Es una pregunta extraña. Los números no son al azar.
fuente