De la randona estadística de Wikipedia :
La aleatoriedad global y la aleatoriedad local son diferentes. La mayoría de las concepciones filosóficas de la aleatoriedad son globales, porque se basan en la idea de que "a la larga" una secuencia se ve realmente aleatoria, incluso si ciertas subsecuencias no se verían al azar. En una secuencia "verdaderamente" aleatoria de números de longitud suficiente, por ejemplo, es probable que haya secuencias largas de nada más que ceros, aunque en general la secuencia podría ser aleatoria. La aleatoriedad local se refiere a la idea de que puede haber longitudes de secuencia mínimas en las que las distribuciones aleatorias se aproximan.Largos tramos de los mismos dígitos, incluso aquellos generados por procesos "verdaderamente" aleatorios, disminuirían la "aleatoriedad local" de una muestra (podría ser solo localmente aleatorio para secuencias de 10,000 dígitos; tomar secuencias de menos de 1,000 podría no parecer aleatorio en absoluto, por ejemplo).
Una secuencia que muestra un patrón no se demuestra estadísticamente al azar. Según los principios de la teoría de Ramsey, los objetos suficientemente grandes deben contener necesariamente una subestructura dada ("el desorden completo es imposible").
No entiendo bien el significado de las dos oraciones en negrita.
¿La primera oración significa que algo hace que una secuencia local sea aleatoria en una longitud más larga y no local aleatoria en una longitud más corta?
¿Cómo funciona el ejemplo dentro del paréntesis?
- ¿La segunda oración significa que una secuencia que exhibe un patrón no puede probarse que no sea estadísticamente aleatoria? ¿Por qué?
Gracias
fuente
Respuestas:
El concepto puede ilustrarse perfectamente mediante algún código ejecutable. Comenzamos (en
R
) usando un buen generador de números pseudoaleatorios para crear una secuencia de 10,000 ceros y unos:Esto pasa algunas pruebas básicas de números aleatorios. Por ejemplo, una prueba t para comparar la media de tiene un valor de p de 40,09 %, lo que nos permite aceptar la hipótesis de que los ceros y unos son igualmente probables.1/2 40.09
De estos números procedemos a extraer una subsecuencia de valores sucesivos comenzando en el valor 5081:1000
Si estos deben parecer aleatorios, también deben pasar las mismas pruebas de números aleatorios. Por ejemplo, probemos si su media es 1/2:
El valor p bajo (menos de 1%) sugiere fuertemente la media es significativamente mayor que . De hecho, la suma acumulativa de esta subsecuencia tiene una fuerte tendencia al alza:1/2
¡Ese no es un comportamiento al azar!
La comparación de la secuencia original (trazada como una suma acumulativa) con esta subsecuencia revela lo que está sucediendo:
De hecho, la secuencia larga se comporta como una caminata aleatoria, como debería, pero la subsecuencia particular que extraje contiene el aumento ascendente más largo entre todas las subsecuencias de la misma longitud. ¡Parece que también podría haber extraído algunas subsecuencias que exhiben un comportamiento "no aleatorio", como el centrado alrededor de donde aparecen aproximadamente 20 unidades seguidas!9000
Como han demostrado estos análisis simples, ninguna prueba puede "probar" que una secuencia parece aleatoria. Todo lo que podemos hacer es probar si las secuencias se desvían bastante de los comportamientos esperados de secuencias aleatorias a ofrecer pruebas de que son no al azar. Así es como funcionan las baterías de las pruebas de números aleatorios : buscan patrones altamente improbables en secuencias de números aleatorios. De vez en cuando, nos harán concluir que una secuencia de números verdaderamente aleatoria no parece aleatoria: la rechazaremos e intentaremos otra cosa.
Sin embargo, a la larga, al igual que todos estamos muertos, cualquier generador de números verdaderamente aleatorio generará cada secuencia posible de 1000 dígitos, y lo hará infinitamente muchas veces. Lo que nos rescata de un dilema lógico es que tendríamos que esperar mucho tiempo para que ocurra una aberración tan aparente.
fuente
Este extracto utiliza los términos "aleatoriedad local" y "aleatoriedad global" para distinguir entre lo que puede ocurrir con un número finito de muestras de una variable aleatoria y la distribución de probabilidad o expectativa de una variable aleatoria.
Sin embargo, al evaluar la media muestral para muestras finitas obtendremos todo tipo de valores en[0,1] [a,b] 0≤a<b≤1 θ
Nada nuevo aquí.
Por lo tanto, no quemaría demasiadas células cerebrales pensando en este extracto. No es matemáticamente tan preciso y en realidad es engañoso sobre la naturaleza de la aleatoriedad.
Edición basada en el comentario: @kjetilbhalvorsen +1 a su comentario para el conocimiento histórico. Sin embargo, sigo pensando que el valor de estos términos es limitado y engañoso. Las tablas que está describiendo parecen tener la implicación engañosa de que las muestras pequeñas que tienen, por ejemplo, una muestra significan lejos del valor real esperado o tal vez una secuencia larga improbable pero ciertamente posible de 0 repetidos (en mi ejemplo de Bernoulli), de alguna manera exhiben menos aleatoriedad (al decir que no exhiben esta falsa "aleatoriedad local"). ¡No puedo pensar en nada más engañoso para el incipiente estadístico!
fuente
Creo que los autores de la publicación de Wikipedia están malinterpretando la aleatoriedad. Sí, puede haber tramos que parecen no ser aleatorios, pero si el proceso que creó la secuencia es verdaderamente aleatorio, también debe ser la salida. Si ciertas secuencias parecen no ser aleatorias, esa es una percepción errónea del lector (es decir, los humanos están diseñados para encontrar patrones). Nuestra capacidad de ver el Big Dipper, y Orion, etc. en el cielo nocturno no es evidencia de que los patrones de las estrellas no sean aleatorios. Estoy de acuerdo en que la aleatoriedad a menudo parece no aleatoria. Si un proceso genera patrones verdaderamente no aleatorios para secuencias cortas, no es un proceso aleatorio.
No creo que el proceso cambie a diferentes tamaños de muestra. Aumenta el tamaño de la muestra, aumenta la probabilidad de que veamos una secuencia aleatoria que nos parece no aleatoria. Si hay un 10% de posibilidades de que veamos un patrón en 20 observaciones aleatorias, aumentar el número total de observaciones a 10000 aumentaría la probabilidad de que veamos no aleatoriedad, en algún lugar.
fuente