Estoy trabajando en el aprendizaje de la probabilidad y las estadísticas leyendo algunos libros y escribiendo un código, y mientras simulaba lanzar monedas noté algo que me pareció ligeramente contrario a la ingenua intuición. Si lanzas una moneda justa veces, la proporción de cara a cruz converge hacia 1 a medida que aumenta, exactamente como esperarías. Pero, por otro lado, a medida que aumenta , parece que es menos probable que voltee exactamente el mismo número de caras que colas, obteniendo así una relación de exactamente 1.
Por ejemplo (alguna salida de mi programa)
For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)
Mi pregunta es la siguiente: ¿hay un concepto / principio en estadística / teoría de la probabilidad que explique esto? Si es así, ¿qué principio / concepto es?
Enlace al código si alguien está interesado en ver cómo generé esto.
- editar -
Por lo que vale, así es como me estaba explicando esto antes. Si una moneda justa veces y el número de , básicamente estás generando un número aleatorio. Del mismo modo, si haces lo mismo y cuentas las colas, también estás generando un número aleatorio. Entonces, si cuenta ambos, realmente está generando dos números aleatorios, y a medida que , los números aleatorios aumentan. Y cuanto más grandes sean los números aleatorios que genere, más posibilidades hay de que se "pierdan" entre sí. Lo que hace que esto sea interesante es que los dos números en realidad están vinculados en cierto sentido, con su relación convergente hacia uno a medida que crecen, a pesar de que cada número es aleatorio de forma aislada. Tal vez solo soy yo, pero encuentro ese tipo de aseado.
fuente
Respuestas:
Tenga en cuenta que el caso en el que el número de caras y el número de colas son iguales es "exactamente la mitad del tiempo que obtiene caras". Entonces, sigamos contando el número de caras para ver si es la mitad del número de lanzamientos o comparando de manera equivalente la proporción de caras con 0.5.
Cuanto más voltee, mayor será el número de posibles recuentos de cabezas que puede tener: la distribución se vuelve más dispersa (por ejemplo, un intervalo para el número de caras que contiene el 95% de la probabilidad aumentará a medida que aumente el número de lanzamientos) , por lo que la probabilidad de exactamente medias cabezas tenderá a disminuir a medida que arrojemos más.
En consecuencia, la proporción de cabezas tomará más valores posibles; mira aquí, donde pasamos de 100 lanzamientos a 200 lanzamientos:
Con 100 lanzamientos podemos observar una proporción de 0.49 cabezas o 0.50 cabezas o 0.51 cabezas (y así sucesivamente, pero nada entre esos valores), pero con 200 lanzamientos, podemos observar 0.49 o 0.495 o 0.50 o 0.505 o 0.510 - el la probabilidad tiene más valores para "cubrir" y, por lo tanto, cada uno tenderá a obtener una participación menor.
Considere que tiene lanzamientos con cierta probabilidad de obtener heads (conocemos estas probabilidades pero no es crítico para esta parte), y agrega dos lanzamientos más. En lanzamientos, cabezas es el resultado más probable ( y se reduce desde allí).p i i 2 n n p n > p n ± 12n pi i 2n n pn>pn±1
¿Cuál es la posibilidad de tener caras en lanzamientos?2 n + 2n+1 2n+2
(Etiquete estas probabilidades con para que no las confundamos con las anteriores; también deje que P (HH) sea la probabilidad de "Cabeza, Cabeza" en los próximos dos lanzamientos, y así sucesivamente)q
es decir, si agrega dos lanzamientos de monedas más, la probabilidad del valor medio disminuye naturalmente porque promedia el valor más probable (medio) con el promedio de los valores más pequeños a cada lado)
Por lo tanto, siempre y cuando se sienta cómodo de que el pico estará en el medio (durante ), la probabilidad de exactamente medias cabezas debe disminuir a medida que sube.norte2n=2,4,6,... n
De hecho, podemos mostrar que para grande , disminuye proporcionalmente con (como era de esperar, ya que la distribución del número estandarizado de cabezas se aproxima a la normalidad y la variación de la proporción de cabezas disminuye con )n pn 1n√ n
Según lo solicitado, aquí hay un código R que produce algo cercano a la trama anterior:
fuente
Bien, sabemos que la Ley de Números Grandes es lo que garantiza la primera conclusión de su experimento, es decir, que si lanza una moneda justa veces, la proporción de cara a cruz converge hacia 1 a medida que aumenta.n n
Así que no hay problemas allí. Sin embargo, eso sobre toda la Ley de Grandes Números nos dice en este escenario.
Pero ahora, piense en este problema de manera más intuitiva. Piense en lanzar una moneda varias veces, por ejemplo: .n=2,4,8,10
Cuando lanzas una moneda dos veces, es decir, , piensa en los posibles escenarios de los dos lanzamientos. (Aquí denotará cabezas y denotará colas). En la solapa del puño que podría haber conseguido y en el segundo tirón que podría haber conseguido . Pero esa es solo una forma en que los dos cambios podrían haber surgido. También podría haber obtenido el primer flip y el segundo flip , y todas las demás combinaciones posibles. Entonces, al final del día, cuando lanzas 2 monedas, las combinaciones posibles que puedes ver en los dos lanzamientos son y entonces hay 4 escenarios posibles para lanzar monedasn=2 H T H T T H
Si lanzara 4 monedas, el número posible de combinaciones que podría ver sería por lo que hay 16 escenarios posibles para lanzar monedas.
Voltear monedas conduce a 256 combinaciones.n=8
Voltear monedas conduce a 1,024 combinaciones.n=10
Y, en particular, voltear cualquier número monedas conduce a combinaciones posibles.n 2n
Ahora, intentemos acercarnos a este punto de vista probabilístico del problema. Mirando hacia atrás en el caso cuando , sabemos que la probabilidad de obtener exactamente el mismo número de Cara y Cola (es decir, como lo pones con una razón de exactamente 1) es Cuando , sabemos que la probabilidad de obtener exactamente el mismo número de Caras y Colas esn=2
Y en general, a medida que tiende a crecer, tenemos que la probabilidad de obtener exactamente el mismo número de cara y cruz va a 0.n
En otras palabras, como , tenemos ese P r ( relación de exactamente 1 ) → 0n→∞
Y así, para responder a tu pregunta. Realmente lo que está observando es solo una consecuencia del hecho de que habrá muchas más combinaciones de lanzamientos de monedas donde el número de caras y colas no es igual en comparación con el número de combinaciones donde son iguales.
Como sugiere @Mark L. Stone, si se siente cómodo con la fórmula binomial y las variables aleatorias binomiales, puede usar eso para mostrar el mismo argumento.
Sea el número de caras registradas al lanzar una moneda justa veces. podemos considerar como una variable aleatoria que proviene de una distribución binomial, es decir, (aquí asumimos porque estamos tratando con una moneda justa), entonces la probabilidad de obtener exactamente el mismo número de caras que el número de colas (es decir, una relación de exactamente 1) esn X X ∼ B i n ( n , p = 0.5 ) p = 0.5X n X X∼Bin(n,p=0.5) p=0.5
Ahora, una vez más, como tiende a crecer, la expresión anterior tiende a 0 porque como .n (nn/2)0.5n→0 n→∞
fuente
Ver el triángulo de Pascal .
La probabilidad de resultados de lanzamiento de moneda está representada por los números a lo largo de la fila inferior. El resultado de igual cara y cruz es el número del medio. A medida que el árbol crece (es decir, más volteretas), el número del medio se convierte en una proporción menor de la suma de la fila inferior.
fuente
Tal vez ayude esbozar que esto está relacionado con la ley del arcoseno. Dice que para un camino de resultados, la probabilidad de que el camino permanezca la mayor parte del tiempo en el dominio positivo o negativo es mucho más alta que la que sube y baja de lo que espera de la intuición . Aquí algunos enlaces:
http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml
https://en.wikipedia.org/wiki/Arcsine_law
fuente
Mientras que la proporción de cara a cruz converge a 1, el rango de números posibles se amplía. (Estoy inventando los números). Digamos que para 100 tiros, la probabilidad es del 90% de que tienes entre 45% y 55% de cabezas. Eso es 90% que obtienes de 45 a 55 cabezas. 11 posibilidades para el número de cabezas. Aproximadamente el 9% aproximadamente que obtienes el mismo número de caras y colas.
Digamos que para 10,000 tiros, la probabilidad es del 95% de que obtengas entre 49% y 51% de cabezas. Entonces, la relación se ha acercado mucho a 1. Pero ahora tienes entre 4,900 y 5,100 cabezas. 201 posibilidades. La probabilidad de números iguales es de aproximadamente un 0,5%.
Y con un millón de lanzamientos, está seguro de tener entre 49.9% y 50.1% de cabezas. Eso es un rango de 499,000 a 501,000 cabezas. 2.001 posibilidades. La posibilidad ahora ha bajado al 0.05%.
Ok, las matemáticas estaban inventadas. Pero esto debería darle una idea sobre el "por qué". A pesar de que la proporción se acerca a 1, el número de posibilidades se vuelve mayor, de modo que golpear exactamente la mitad de la cabeza y la mitad de la cola se vuelve cada vez menos probable.
Otro efecto práctico: es poco probable en la práctica que tengas una moneda donde la probabilidad de lanzar caras sea exactamente del 50%. Podría ser 49.99371% si tienes una moneda realmente buena. Para un pequeño número de lanzamientos, esto no hace la diferencia. Para números grandes, el porcentaje de cabezas convergerá al 49.99371%, no al 50%. Si el número de lanzamientos es lo suficientemente grande, lanzar 50% o más cabezas será muy, muy improbable.
fuente
Bueno, una cosa a tener en cuenta es que con un número par de volteretas (de lo contrario, la probabilidad de volteos iguales de cara y cruz es, por supuesto, exactamente cero), el resultado más probable siempre será el que tenga exactamente tantos volteos de cabeza como de cola.
La distribución de flips está dada por los coeficientes del polinomio Entonces, incluso para , la probabilidad es ( 1 + xn n p n = 2 - n ( n
Usando la aproximación de Stirling para, llega a algo así como para la probabilidad de exactamente caras (y colas correspondientes) para volteos generales. Por lo tanto, la probabilidad absoluta de este resultado converge a 0 pero mucho más lenta que la mayoría de los otros resultados, con los casos extremos de 0 caras (o alternativamente 0 colas) volteadas .p ≈ 1n! n/2n2-n
fuente
Supongamos que lanzas una moneda dos veces. Hay cuatro resultados posibles: HH, HT, TH y TT. En dos de estos, tiene el mismo número de caras y colas, por lo que hay un 50% de posibilidades de obtener el mismo número de caras y colas.
Ahora suponga que lanza una moneda 4,306,492,102 veces. ¿Esperas un 50 por ciento de posibilidades de terminar exactamente con 2,153,246,051 cabezas y 2,153,246,051 colas?
fuente