Lanzamos un dado de 6 lados muchas veces.
Calculando la diferencia (valor absoluto) entre un rollo y su rollo anterior, ¿se espera que las diferencias se distribuyan uniformemente?
Para ilustrar con 10 rollos:
roll num result diff
1 1 0
2 2 1
3 1 1
4 3 2
5 3 0
6 5 2
7 1 4
8 6 5
9 4 2
10 4 0
¿ diff
Se distribuirían los valores de manera uniforme?
distributions
uniform
Hola judeo
fuente
fuente
Respuestas:
No, no es uniforme
Puede contar las posibilidades igualmente probables para las diferencias absolutas36
lo que da una distribución de probabilidad para las diferencias absolutas de
fuente
Usando solo los axiomas más básicos sobre probabilidades y números reales, se puede demostrar una afirmación mucho más fuerte:
(Una declaración análoga para variables continuas se prueba en PDF uniforme de la diferencia de dos rv .)
La idea es que la posibilidad de queX−Y sea un valor extremo debe ser menor que la posibilidad de que X−Y sea cero, porque solo hay una forma de (por ejemplo) maximizar X−Y mientras que hay muchas maneras de hacer que la diferencia sea cero , porque X e Y tienen la misma distribución y, por lo tanto, pueden ser iguales entre sí. Aquí están los detalles.
Primero, observe que las dos variables hipotéticasX e Y en cuestión solo pueden alcanzar un número finito n de valores con probabilidad positiva, porque habrá al menos n diferencias distintas y una distribución uniforme les asigna a todos la misma probabilidad. Si n es infinito, entonces también lo sería el número de posibles diferencias con probabilidad positiva igual, de donde la suma de sus posibilidades sería infinita, lo cual es imposible.
Finalmente , debido a y tienen la misma distribución, hay muchas maneras de sus diferencias pueden producir el valor Entre estas formas son los casos en los que y Debido a que esta distribución no es constante, difiere de Eso muestra que esos dos casos son eventos disjuntos y, por lo tanto, deben contribuir al menos una cantidad a la posibilidad de que sea cero; es decir,X Y 0. X=Y=m X=Y=M. m M. p 2 + q 2 X - Yp2+q2 X−Y
Como los cuadrados de los números no son negativos, donde deducimos de que0≤(p−q)2, (∗)
mostrando la distribución de no es uniforme, QED.X−Y
Editar en respuesta a un comentario
Un análisis similar de las diferencias absolutasobserva que debido a que e tienen la misma distribución,Esto requiere que estudiemosLa misma técnica algebraica produce casi el mismo resultado, pero existe la posibilidad de que yEse sistema de ecuaciones tiene la solución única|X−Y| X Y m=−M. Pr(X−Y=|M−m|)=2pq. 2pq=2pq+(p−q)2 2pq+p2+q2=1. p=q=1/2 correspondiente a una moneda justa (un "dado de dos caras"). Además de esta excepción, el resultado para las diferencias absolutas es el mismo que para las diferencias, y por las mismas razones subyacentes ya dadas: a saber, las diferencias absolutas de dos variables aleatorias iid no pueden distribuirse uniformemente cuando hay más de dos diferencias distintas con probabilidad positiva
(fin de la edición)
Apliquemos este resultado a la pregunta, que pregunta sobre algo un poco más complejo.
Modele cada tirada independiente del dado (que podría ser un dado injusto ) con una variable aleatoria Las diferencias observadas en estos rollos son los números Podríamos preguntarnos qué tan uniformemente distribuidos están estos números . Esa es realmente una pregunta sobre las expectativas estadísticas: ¿cuál es el número esperado de que es igual a cero, por ejemplo? ¿Cuál es el número esperado de igual a ? Etcétera etcétera.Xi, i=1,2,…,n. n ΔXi=Xi+1−Xi. n−1 ΔXi ΔXi −1
El aspecto problemático de esta pregunta es que no son independientes: por ejemplo, y involucran el mismo rolloΔXi Δ X 1 = X 2 - X 1 Δ X 2 = X 3 - X 2 X 2 .ΔX1=X2−X1 ΔX2=X3−X2 X2.
Sin embargo, esto no es realmente una dificultad. Como la expectativa estadística es aditiva y todas las diferencias tienen la misma distribución, si seleccionamos cualquier valor posible de las diferencias, el número esperado de veces que la diferencia es igual a en toda la secuencia de rollos es solo veces el número esperado de veces la diferencia es igual a en un solo paso del proceso. Esa expectativa de un solo paso es (para cualquier ). Estas expectativas serán las mismas para todas las (es decir, uniformes ) si y solo si son las mismas para un solok k n n−1 k Pr(ΔXi=k) i k Δ X i . Δ X iΔXi. Pero hemos visto que no tiene una distribución uniforme, incluso cuando el dado puede estar sesgado. Por lo tanto, incluso en este sentido más débil de las frecuencias esperadas, las diferencias de los rodillos no son uniformes.ΔXi
fuente
En un nivel intuitivo, un evento aleatorio solo puede distribuirse uniformemente si todos sus resultados son igualmente probables.
¿Es así para el evento aleatorio en cuestión: diferencia absoluta entre dos tiradas de dados?
En este caso, es suficiente mirar los extremos: ¿cuáles son los valores más grandes y más pequeños que podría tomar esta diferencia?
Obviamente 0 es el más pequeño (estamos viendo diferencias absolutas y las tiradas pueden ser las mismas), y 5 es el más grande (
6
vs1
).Podemos mostrar que el evento no es uniforme al mostrar que
0
es más (o menos) probable que ocurra que5
.De un vistazo, solo hay dos formas de que ocurra 5: si el primer dado es 6 y el segundo 1, o viceversa . ¿De cuántas maneras puede ocurrir 0?
fuente
Según lo presentado por Henry, las diferencias de distribuciones distribuidas uniformemente no están distribuidas uniformemente.
Para ilustrar esto con datos simulados, podemos usar un script R muy simple:
Vemos que esto produce de hecho una distribución uniforme. Veamos ahora la distribución de las diferencias absolutas de dos muestras aleatorias de esta distribución.
fuente
Otros han trabajado los cálculos, le daré una respuesta que me parece más intuitiva. Desea estudiar la suma de dos unifrom rv (Z = X + (-Y)), la distribución general es el producto de convolución (discreto):
Esta suma es bastante intuitiva: la probabilidad de obtener , es la suma de las probabilidades de obtener algo con X (anotado aquí) y el complemento de con -Y.z k z
Por el procesamiento de la señal, sabemos cómo se comporta el producto de convolución:
Puede comprender lo que sucede aquí: a medida que mueve hacia arriba (la línea de puntos vertical), el dominio común de ambos rectángulos se mueve hacia arriba y hacia abajo, lo que corresponde a la probabilidad de obtener .z z
En términos más generales, sabemos que las únicas funciones que son estables por convolución son las de la familia gaussiana. es decir, solo la distribución gaussiana es estable por adición (o más generalmente, combinación lineal). Esto también significa que no se obtiene una distribución uniforme cuando se combinan distribuciones uniformes.
En cuanto a por qué obtenemos esos resultados, la respuesta radica en la descomposición de Fourrier de esas funciones. La transformación de Fourrier de un producto de convolución es el producto simple de las transformaciones de Fourrier de cada función. Esto proporciona enlaces directos entre los coeficientes de cuatro niveles de las funciones de rectángulo y triángulo.
fuente
Si e son dos tiradas de dados consecutivas, puede visualizar (para ) de la siguiente manera donde cada color corresponde a un valor diferente de :x y |x−y|=k k=0,1,2,3,4,5 k
Como puede ver fácilmente, el número de puntos para cada color no es el mismo; por lo tanto, las diferencias no están distribuidas uniformemente.
fuente
Supongamos que denota la diferencia y el valor del rollo, luegoDt X P(Dt=5)=P(Xt=6,Xt−1=1)<P((Xt,Xt−1)∈{(6,3),(5,2)})<P(Dt=3)
Entonces la función no es constante en . Esto significa que la distribución no es uniforme.P(Dt=d) d
fuente