¿Concepto de estadísticas para explicar por qué es menos probable que voltee el mismo número de caras que colas, a medida que aumenta el número de volteos?

28

Estoy trabajando en el aprendizaje de la probabilidad y las estadísticas leyendo algunos libros y escribiendo un código, y mientras simulaba lanzar monedas noté algo que me pareció ligeramente contrario a la ingenua intuición. Si lanzas una moneda justa veces, la proporción de cara a cruz converge hacia 1 a medida que aumenta, exactamente como esperarías. Pero, por otro lado, a medida que aumenta , parece que es menos probable que voltee exactamente el mismo número de caras que colas, obteniendo así una relación de exactamente 1.nnn

Por ejemplo (alguna salida de mi programa)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Mi pregunta es la siguiente: ¿hay un concepto / principio en estadística / teoría de la probabilidad que explique esto? Si es así, ¿qué principio / concepto es?

Enlace al código si alguien está interesado en ver cómo generé esto.

- editar -

Por lo que vale, así es como me estaba explicando esto antes. Si una moneda justa veces y el número de , básicamente estás generando un número aleatorio. Del mismo modo, si haces lo mismo y cuentas las colas, también estás generando un número aleatorio. Entonces, si cuenta ambos, realmente está generando dos números aleatorios, y a medida que , los números aleatorios aumentan. Y cuanto más grandes sean los números aleatorios que genere, más posibilidades hay de que se "pierdan" entre sí. Lo que hace que esto sea interesante es que los dos números en realidad están vinculados en cierto sentido, con su relación convergente hacia uno a medida que crecen, a pesar de que cada número es aleatorio de forma aislada. Tal vez solo soy yo, pero encuentro ese tipo de aseado. nn

crimen mental
fuente
¿Buscas explicaciones intuitivas o matemáticas?
Glen_b -Reinstalar Monica
1
Ambos, de verdad. Creo que tipo de entender la razón en un sentido intuitivo, pero me gustaría entender el razonamiento formal detrás de él.
mindcrime
1
¿Sabes cómo calcular probabilidades binomiales y aplicarlas a esta situación? Si no, búsquelo y calcule los cálculos.
Mark L. Stone
Wow, hay varias buenas respuestas a esta pregunta. Me siento mal por tener que aceptar uno y no el otro. Permítanme decir que aprecio todas las respuestas y todos los que se tomaron el tiempo para compartir sus ideas sobre esto.
mindcrime

Respuestas:

31

Tenga en cuenta que el caso en el que el número de caras y el número de colas son iguales es "exactamente la mitad del tiempo que obtiene caras". Entonces, sigamos contando el número de caras para ver si es la mitad del número de lanzamientos o comparando de manera equivalente la proporción de caras con 0.5.

Cuanto más voltee, mayor será el número de posibles recuentos de cabezas que puede tener: la distribución se vuelve más dispersa (por ejemplo, un intervalo para el número de caras que contiene el 95% de la probabilidad aumentará a medida que aumente el número de lanzamientos) , por lo que la probabilidad de exactamente medias cabezas tenderá a disminuir a medida que arrojemos más.

En consecuencia, la proporción de cabezas tomará más valores posibles; mira aquí, donde pasamos de 100 lanzamientos a 200 lanzamientos:

ingrese la descripción de la imagen aquí

Con 100 lanzamientos podemos observar una proporción de 0.49 cabezas o 0.50 cabezas o 0.51 cabezas (y así sucesivamente, pero nada entre esos valores), pero con 200 lanzamientos, podemos observar 0.49 o 0.495 o 0.50 o 0.505 o 0.510 - el la probabilidad tiene más valores para "cubrir" y, por lo tanto, cada uno tenderá a obtener una participación menor.

Considere que tiene lanzamientos con cierta probabilidad de obtener heads (conocemos estas probabilidades pero no es crítico para esta parte), y agrega dos lanzamientos más. En lanzamientos, cabezas es el resultado más probable ( y se reduce desde allí).p i i 2 n n p n > p n ± 12npii2nnpn>pn±1

¿Cuál es la posibilidad de tener caras en lanzamientos?2 n + 2n+12n+2

(Etiquete estas probabilidades con para que no las confundamos con las anteriores; también deje que P (HH) sea la probabilidad de "Cabeza, Cabeza" en los próximos dos lanzamientos, y así sucesivamente)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

es decir, si agrega dos lanzamientos de monedas más, la probabilidad del valor medio disminuye naturalmente porque promedia el valor más probable (medio) con el promedio de los valores más pequeños a cada lado)

Por lo tanto, siempre y cuando se sienta cómodo de que el pico estará en el medio (durante ), la probabilidad de exactamente medias cabezas debe disminuir a medida que sube.norte2n=2,4,6,...n


De hecho, podemos mostrar que para grande , disminuye proporcionalmente con (como era de esperar, ya que la distribución del número estandarizado de cabezas se aproxima a la normalidad y la variación de la proporción de cabezas disminuye con )npn1nn


Según lo solicitado, aquí hay un código R que produce algo cercano a la trama anterior:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)
Glen_b -Reinstate a Monica
fuente
1
Estoy de acuerdo con @RustyStatistician arriba con respecto a las 1000 palabras de su gráfico. Crédito extra por puntero al código.
TomRoche
¡Impresionante figura y explicación!
@ Tom incluí un código que hace todo excepto hacer que el "200" en el título sea verde.
Glen_b: reinstala a Mónica el
1
@Glen_b Gracias por otra gran publicación y la generosidad de compartir las líneas de código. Hermosa parcela! Es difícil admitirlo, pero tengo problemas con la expresión matemática del concepto en su publicación, y en particular con el uso de la mayúscula . P
Antoni Parellada
1
@Antoni solo significa "probabilidad de obtener 'Cabeza, Cabeza' en los dos lanzamientos adicionales". Para obtener n + 1 caras en 2n + 2 lanzamientos, en 2n lanzamientos debe haber tenido n-1 cabezas (y luego arrojó 2 cabezas) o n cabezas (y luego arrojó 1 cabeza) o n + 1 cabeza (y luego arrojó 0 cabezas). P(HH)
Glen_b -Reinstala a Monica el
19

Bien, sabemos que la Ley de Números Grandes es lo que garantiza la primera conclusión de su experimento, es decir, que si lanza una moneda justa veces, la proporción de cara a cruz converge hacia 1 a medida que aumenta. nn

Así que no hay problemas allí. Sin embargo, eso sobre toda la Ley de Grandes Números nos dice en este escenario.

Pero ahora, piense en este problema de manera más intuitiva. Piense en lanzar una moneda varias veces, por ejemplo: .n=2,4,8,10

Cuando lanzas una moneda dos veces, es decir, , piensa en los posibles escenarios de los dos lanzamientos. (Aquí denotará cabezas y denotará colas). En la solapa del puño que podría haber conseguido y en el segundo tirón que podría haber conseguido . Pero esa es solo una forma en que los dos cambios podrían haber surgido. También podría haber obtenido el primer flip y el segundo flip , y todas las demás combinaciones posibles. Entonces, al final del día, cuando lanzas 2 monedas, las combinaciones posibles que puedes ver en los dos lanzamientos son y entonces hay 4 escenarios posibles para lanzar monedasn=2HTHTTH

S={HH,HT,TH,TT}
n=2

Si lanzara 4 monedas, el número posible de combinaciones que podría ver sería por lo que hay 16 escenarios posibles para lanzar monedas.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Voltear monedas conduce a 256 combinaciones.n=8

Voltear monedas conduce a 1,024 combinaciones.n=10

Y, en particular, voltear cualquier número monedas conduce a combinaciones posibles.n2n

Ahora, intentemos acercarnos a este punto de vista probabilístico del problema. Mirando hacia atrás en el caso cuando , sabemos que la probabilidad de obtener exactamente el mismo número de Cara y Cola (es decir, como lo pones con una razón de exactamente 1) es Cuando , sabemos que la probabilidad de obtener exactamente el mismo número de Caras y Colas es n=2

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

Y en general, a medida que tiende a crecer, tenemos que la probabilidad de obtener exactamente el mismo número de cara y cruz va a 0.n

En otras palabras, como , tenemos ese P r ( relación de exactamente 1 ) 0n

Pr(Ratio of exactly 1)0

Y así, para responder a tu pregunta. Realmente lo que está observando es solo una consecuencia del hecho de que habrá muchas más combinaciones de lanzamientos de monedas donde el número de caras y colas no es igual en comparación con el número de combinaciones donde son iguales.



Como sugiere @Mark L. Stone, si se siente cómodo con la fórmula binomial y las variables aleatorias binomiales, puede usar eso para mostrar el mismo argumento.

Sea el número de caras registradas al lanzar una moneda justa veces. podemos considerar como una variable aleatoria que proviene de una distribución binomial, es decir, (aquí asumimos porque estamos tratando con una moneda justa), entonces la probabilidad de obtener exactamente el mismo número de caras que el número de colas (es decir, una relación de exactamente 1) esn X X B i n ( n , p = 0.5 ) p = 0.5XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Ahora, una vez más, como tiende a crecer, la expresión anterior tiende a 0 porque como .n(nn/2)0.5n0n


fuente
2
Debe decir un poco más que como ... también debe decir algo sobre también. (Para comparación: solo porque , no significa ). 0.5n0n 0.5n0n! 0,5n0(nn/2)0.5n0n!0.5n0
Silverfish
@Glen_b No tengo suficientes puntos para comentar tu publicación, ¡pero un gráfico increíble!
Gracias @RustyStatistician, eso ayuda mucho. La primera parte de su explicación coincide bastante con la forma en que estaba pensando, pero no estoy lo suficientemente lejos junto con mis estadísticas aún para saber cómo resolverlo usando la distribución Binomial. Básicamente leí mi libro una vez, sin resolver problemas ni nada, y ahora estoy volviendo al principio y escribiendo código para explorar varios aspectos del material.
Mindcrime
@mindcrime suena genial! Me alegro de poder ayudar.
5

Ver el triángulo de Pascal .

La probabilidad de resultados de lanzamiento de moneda está representada por los números a lo largo de la fila inferior. El resultado de igual cara y cruz es el número del medio. A medida que el árbol crece (es decir, más volteretas), el número del medio se convierte en una proporción menor de la suma de la fila inferior.

Joshua O'Brien
fuente
1

Mientras que la proporción de cara a cruz converge a 1, el rango de números posibles se amplía. (Estoy inventando los números). Digamos que para 100 tiros, la probabilidad es del 90% de que tienes entre 45% y 55% de cabezas. Eso es 90% que obtienes de 45 a 55 cabezas. 11 posibilidades para el número de cabezas. Aproximadamente el 9% aproximadamente que obtienes el mismo número de caras y colas.

Digamos que para 10,000 tiros, la probabilidad es del 95% de que obtengas entre 49% y 51% de cabezas. Entonces, la relación se ha acercado mucho a 1. Pero ahora tienes entre 4,900 y 5,100 cabezas. 201 posibilidades. La probabilidad de números iguales es de aproximadamente un 0,5%.

Y con un millón de lanzamientos, está seguro de tener entre 49.9% y 50.1% de cabezas. Eso es un rango de 499,000 a 501,000 cabezas. 2.001 posibilidades. La posibilidad ahora ha bajado al 0.05%.

Ok, las matemáticas estaban inventadas. Pero esto debería darle una idea sobre el "por qué". A pesar de que la proporción se acerca a 1, el número de posibilidades se vuelve mayor, de modo que golpear exactamente la mitad de la cabeza y la mitad de la cola se vuelve cada vez menos probable.

Otro efecto práctico: es poco probable en la práctica que tengas una moneda donde la probabilidad de lanzar caras sea exactamente del 50%. Podría ser 49.99371% si tienes una moneda realmente buena. Para un pequeño número de lanzamientos, esto no hace la diferencia. Para números grandes, el porcentaje de cabezas convergerá al 49.99371%, no al 50%. Si el número de lanzamientos es lo suficientemente grande, lanzar 50% o más cabezas será muy, muy improbable.

gnasher729
fuente
0

Bueno, una cosa a tener en cuenta es que con un número par de volteretas (de lo contrario, la probabilidad de volteos iguales de cara y cruz es, por supuesto, exactamente cero), el resultado más probable siempre será el que tenga exactamente tantos volteos de cabeza como de cola.

La distribución de flips está dada por los coeficientes del polinomio Entonces, incluso para , la probabilidad es ( 1 + xnn p n = 2 - n ( n

(1+x2)n.
n
pn=2n(nn/2).

Usando la aproximación de Stirling para, llega a algo así como para la probabilidad de exactamente caras (y colas correspondientes) para volteos generales. Por lo tanto, la probabilidad absoluta de este resultado converge a 0 pero mucho más lenta que la mayoría de los otros resultados, con los casos extremos de 0 caras (o alternativamente 0 colas) volteadas .p 1n! n/2n2-n

p1πn/2
n/2n2n
usuario95629
fuente
2
Su respuesta podría mejorarse definiendo cuidadosamente las cantidades en sus expresiones. ¿Qué es ? ¿Qué es ? pnp
Sycorax dice Reinstate Monica
0

Supongamos que lanzas una moneda dos veces. Hay cuatro resultados posibles: HH, HT, TH y TT. En dos de estos, tiene el mismo número de caras y colas, por lo que hay un 50% de posibilidades de obtener el mismo número de caras y colas.

Ahora suponga que lanza una moneda 4,306,492,102 veces. ¿Esperas un 50 por ciento de posibilidades de terminar exactamente con 2,153,246,051 cabezas y 2,153,246,051 colas?

Daniel McLaury
fuente
No, mi intuición me dijo que las posibilidades de obtener una coincidencia exacta eran bajas, solo porque los números eran cada vez mayores. Pero quería simularlo solo para confirmar mi pensamiento. Cuando vi que resultó de esa manera, me intrigó el razonamiento formal detrás de por qué es así. Me parece interesante que la relación resultante esté convergiendo hacia 1 mientras que simultáneamente sea menos probable que sea exactamente 1.
mindcrime
3
Una forma de pensar en eso es que para grande hay muchas más formas de estar cerca de 50-50 que para pequeña . nnn
Daniel McLaury