Número esperado de razón de nacimiento de niñas vs niños

45

Me encontré con una pregunta en la prueba de aptitud de la entrevista de trabajo para el pensamiento crítico. Es algo así:

La República Zorganiana tiene algunas costumbres muy extrañas. Las parejas solo desean tener hijas, ya que solo las mujeres pueden heredar la riqueza de la familia, por lo que si tienen un hijo varón, seguirán teniendo más hijos hasta que tengan una niña. Si tienen una niña, dejan de tener hijos. ¿Cuál es la relación entre niñas y niños en Zorgania?

No estoy de acuerdo con la respuesta modelo dada por el escritor de la pregunta, que es aproximadamente 1: 1. La justificación fue que cualquier nacimiento siempre tendrá un 50% de posibilidades de ser hombre o mujer.

¿Puede convencerme con una respuesta matemática más vigorosa de si es el número de niñas y B es el número de niños en el país?E[G]:E[B]G

Pizza Mobius
fuente
3
Tiene razón en su desacuerdo con la respuesta modelo porque la proporción M: F de nacimientos es diferente de la proporción M: F de los niños. En las sociedades humanas reales, las parejas que desean tener hijos femeninos probablemente recurrirán a medios como el infanticidio o la adopción extranjera para deshacerse de los hijos varones, lo que resulta en una relación M: F inferior a 1: 1.
Gabe
10
@Gabe No se menciona el infanticidio en la pregunta, es un ejercicio matemático en lugar de un análisis arenoso de un país real donde el asesinato es un lugar común. Igualmente, la proporción real de nacimientos de niños a niñas está más cerca de 51:49 (ignorando los factores sociales)
Richard Tingle
2
Gracias a las respuestas ahora entiendo por qué la relación sería 1: 1, lo que originalmente me suena intuitivo. Una de las razones de mi incredulidad y confusión es que sé que las aldeas en China tienen los problemas opuestos de una proporción demasiado alta de niños: niñas. Puedo ver que, de manera realista, las parejas no podrán continuar procreando indefinidamente hasta que obtengan el género de niño que desean. En China, la ley solo permite un máximo de 2 niños para las personas que viven en zonas rurales, por lo que en ese caso la proporción será más cercana a 3: 2 que 1: 1.
Mobius Pizza
44
@MobiusPizza: ¡No, la proporción es 1: 1 sin importar cuántos hijos tengas! La razón por la que China tiene una proporción diferente se debe a factores sociales como el infanticidio, el aborto selectivo por sexo y la adopción extranjera.
Gabe
3
@newmount Las simulaciones son buenas, pero solo significan tanto como los supuestos incorporados en ellas. Mostrar solo el código, sin ninguna explicación, dificulta que las personas identifiquen esos supuestos. En ausencia de alguna justificación y explicación, ninguna cantidad de salida de simulación abordará la cuestión aquí. En lo que respecta al "mundo real", cualquiera que haga esa afirmación tendrá que respaldarlo con datos sobre nacimientos humanos.
whuber

Respuestas:

46

Comience sin hijos

repetir paso

{

Cada pareja que todavía tiene hijos tiene un hijo. La mitad de las parejas tienen hombres y la otra mitad mujeres.

Aquellas parejas que tienen mujeres dejan de tener hijos.

}

En cada paso obtienes un número par de hombres y mujeres y el número de parejas que tienen hijos se reduce a la mitad (es decir, aquellos que tenían mujeres no tendrán hijos en el siguiente paso)

Por lo tanto, en cualquier momento tiene el mismo número de hombres y mujeres y, de paso a paso, el número de parejas que tienen hijos se reduce a la mitad. A medida que se crean más parejas, la misma situación se repite y todas las demás cosas son iguales, la población contendrá el mismo número de hombres y mujeres.

martino
fuente
66
Creo que esta es una excelente manera de explicar la distribución de probabilidad sin depender de una prueba matemática rigurosa.
LBushkin
1
Lo que me gusta es que esto también explica lo que sucedió con el exceso de chicas que su intuición espera: los padres desean el exceso de chicas (son los padres que lo intentan de nuevo), pero esos padres (en general) nunca crean con éxito un exceso de muchachas.
Ben Jackson
2
Puede simplificar aún más diciendo "repita el paso {alguien decide si tiene o no un hijo}". Las reglas por las cuales deciden son completamente irrelevantes, siempre que todos produzcan niños y niñas independientemente con la misma probabilidad. Ni siquiera es necesario asumir un valor para esa probabilidad, simplemente podría decir que la frecuencia en la población será la misma que la frecuencia al nacer.
Steve Jessop
1
@martino No creo que este sea el caso, aunque no me sorprendería si hubiera algunas matemáticas muy convincentes en este sentido. Creo que este escenario conduce a un colapso en nuestra noción de proporciones, porque el número esperado de hijos por familia es infinito. Debe ser escéptico con respecto a su respuesta debido a la generalidad con la que las personas han respondido su pregunta en este hilo.
jlimahaverford
1
@ martino. Por diversión, acabo de ejecutar una simulación con ese criterio de detención. 10,000 familias tenían un total de 160,693,469 niños (y ese número más 10,000 niñas más) para una proporción de 0.9999377735896915. Cosas bastante increíbles.
jlimahaverford
37

Deje que sea ​​el número de niños en una familia. Tan pronto como tienen una niña, se detienen, así queX

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

Si es la probabilidad de que un niño sea un niño y si los géneros son independientes entre los niños, la probabilidad de que una familia termine teniendo k niños es P ( X = k ) = p k( 1 - p ) , es decir , la probabilidad de tener k niños y luego tener una niña. El número esperado de niños es E X = k = 0 k p k( 1 - p ) =pk

P(X=k)=pk(1p),
k Observando que k = 0 kpk= k = 0 (k+1)pk+1obtenemos k = 0 kpk- k = 0 k
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
k=0kpk=k=0(k+1)pk+1
donde usamos quek = 0 pk=1/(1-p)cuando0<p<1(verseries geométricas).
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
k=0pk=1/(1p)0<p<1

Si , tenemos que E X = 0,5 / 0,5 . Es decir, la familia promedio tiene 1 niño. Ya sabemos que todas las familias tienen 1 niña, por lo que la relación será con el tiempo incluso a ser 1 / 1 = 1 .p=1/2EX=0.5/0.51/1=1

La variable aleatoria se conoce como una variable aleatoria geométrica .X

MånsT
fuente
44
Esto, por supuesto, supone que pes lo mismo para todas las familias. Si, en cambio, suponemos que algunas parejas tienen más probabilidades de tener hijos que otras ( es decir , que pes mayor), entonces el resultado cambia, incluso si el valor promedio de ptodavía es 0.5. (Aún así, esta es una excelente explicación de las estadísticas básicas subyacentes.)
Ben Hocking
2
@Ben Tu comentario contiene una idea clave. Se me ocurrió lo mismo, así que edité mi pregunta para incluir un análisis de esta situación más realista. Muestra que la relación limitante no es necesariamente 1: 1.
whuber
1
@BenHocking De hecho! Y como sabemos por tanto la estadística moderna y el análisis clásico de Laplace de las proporciones de nacimientos, no es igual a 1 / 2 de todos modos. :)p1/2
MånsT
21

Resumen

El modelo simple de que todos los nacimientos independientemente tienen un 50% de posibilidades de ser niñas no es realista y, como resultado, excepcional. Tan pronto como consideramos las consecuencias de la variación en los resultados entre la población, la respuesta es que la relación niña: niño puede ser cualquiera valor que no exceda 1: 1. (En realidad, probablemente todavía estaría cerca de 1: 1, pero eso es una cuestión que el análisis de datos debe determinar).

Debido a que estas dos respuestas en conflicto se obtienen asumiendo independencia estadística de los resultados del nacimiento, una apelación a la independencia es una explicación insuficiente. Por lo tanto, parece que la variación (en las posibilidades de nacimientos femeninos) es la idea clave detrás de la paradoja.

Introducción

Una paradoja ocurre cuando creemos que tenemos buenas razones para creer algo, pero nos enfrentamos a un argumento sólido de lo contrario.

Una resolución satisfactoria a una paradoja nos ayuda a comprender lo que estaba bien y lo que pudo haber estado mal en ambos argumentos. Como suele ser el caso en probabilidad y estadística, ambos argumentos pueden ser válidos: la resolución dependerá de las diferencias entre los supuestos que se hacen implícitamente. Comparar estos supuestos diferentes puede ayudarnos a identificar qué aspectos de la situación conducen a diferentes respuestas. Identificar estos aspectos, mantengo, es lo que más debemos valorar.

Supuestos

Como se desprende de todas las respuestas publicadas hasta ahora, es natural suponer que los nacimientos de mujeres se producen de forma independiente y con constantes las probabilidades de . Es bien sabido que ninguno de los supuestos es realmente cierto, pero parecería que ligeras desviaciones de estos supuestos no deberían afectar mucho la respuesta. Dejanos ver. Para este fin, considere el siguiente modelo más general y más realista:1/2

  1. En cada familia la probabilidad de un parto femenino es una constante p i , independientemente del orden de nacimiento.ipi

  2. En ausencia de una regla de detención, el número esperado de nacimientos femeninos en la población debe ser cercano al número esperado de nacimientos masculinos.

  3. Todos los resultados de nacimiento son (estadísticamente) independientes.

Este todavía no es un modelo completamente realista de nacimientos humanos, en el cual la puede variar con la edad de los padres (particularmente la madre). Sin embargo, es lo suficientemente realista y flexible como para proporcionar una resolución satisfactoria de la paradoja que se aplicará incluso a modelos más generales.pi

Análisis

Aunque es interesante realizar un análisis exhaustivo de este modelo, los puntos principales se hacen evidentes incluso cuando se considera una versión específica, simple (pero algo extrema). Supongamos que la población tiene familias. En la mitad de ellos la posibilidad de un nacimiento femenino es 2 / 3 y en la otra mitad el riesgo de un nacimiento femenino es 1 / 3 . Esto claramente satisface la condición (2): el número esperado de nacimientos de mujeres y hombres es el mismo.2N2/31/3

Considere esas primeras familias. Razonemos en términos de expectativas, entendiendo que los resultados reales serán aleatorios y, por lo tanto, variarán un poco de las expectativas. (La idea detrás del siguiente análisis se transmitió de manera más breve y simple en la respuesta original que aparece al final de esta publicación).N

Sea el número esperado de nacimientos femeninos en una población de N con probabilidad constante de nacimientos femeninos p . Obviamente, esto es proporcional a N y así se puede escribir f ( N , p ) = f ( p ) N . Del mismo modo, sea m ( p ) N el número esperado de nacimientos masculinos.f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • Las primeras familias producen una niña y se detienen. Las otras ( 1 - p ) familias N producen un niño y continúan teniendo hijos. Eso es p N niñas y ( 1 - p ) N niños hasta ahora.pN(1p)NpN(1p)N

  • Las familias restantes están en la misma posición que antes:(1p)N el supuesto de independencia (3) implica que lo que experimentan en el futuro no se ve afectado por el hecho de que su primogénito era un hijo. Por lo tanto, estas familias producirán más niñas ym ( p ) [ ( 1 - p ) N ] más niños.f(p)[(1p)N]m(p)[(1p)N]

Sumando las chicas totales y chicos totales y en comparación con sus valores asumidos de y m ( p ) N da ecuacionesf(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

con soluciones

f(p)=1  and  m(p)=1p1.

El número esperado de niñas en los primeros familias, con p = 2 / 3 , por lo tanto es f ( 2 / 3 ) N = N y el número esperado de los niños es m ( 2 / 3 ) N = N / 2 .Np=2/3f(2/3)N=Nm(2/3)N=N/2

Np=1/3f(1/3)N=Nm(1/3)N=2N

(1+1)N=2N(1/2+2)N=(5/2)NN

E(# girls# boys)2N(5/2)N=45.

¡La regla de detención favorece a los niños!

p1pN

2p(1p)12p(1p).

p010111p=1/2

Resolución

Si su intuición es que detenerse con la primera niña debería producir más niños en la población, entonces está en lo correcto, como lo muestra este ejemplo. Para estar en lo correcto, todo lo que necesita es que la probabilidad de dar a luz a una niña varía (incluso solo un poco) entre las familias.

La respuesta "oficial", que la proporción debe ser cercana a 1: 1, requiere varios supuestos poco realistas y es sensible a ellos: supone que no puede haber variación entre las familias y todos los nacimientos deben ser independientes.

Comentarios

La idea clave destacada por este análisis es que la variación dentro de la población tiene consecuencias importantes. La independencia de los nacimientos, aunque es una suposición simplificadora utilizada para cada análisis en este hilo, no resuelve la paradoja, porque (dependiendo de las otras suposiciones) es consistente tanto con la respuesta oficial como con su opuesto.

pipipi

Si reemplazamos el género por alguna otra expresión genética, entonces obtenemos una explicación estadística simple de la selección natural : una regla que limita diferencialmente el número de descendientes en función de su composición genética puede alterar sistemáticamente las proporciones de esos genes en la próxima generación. Cuando el gen no está ligado al sexo, incluso un pequeño efecto se propagará de forma multiplicativa a través de generaciones sucesivas y puede aumentar rápidamente.


Respuesta original

Cada niño tiene un orden de nacimiento: primogénito, segundo nacido, etc.

Suponiendo probabilidades iguales de nacimientos masculinos y femeninos y sin correlaciones entre los géneros, la Ley Débil de Números Grandes afirma que habrá una proporción cercana a 1: 1 de mujeres primogénitas a hombres. Por la misma razón, habrá una proporción cercana a 1: 1 de segundas hembras a machos, y así sucesivamente. Debido a que estas proporciones son constantemente 1: 1, la proporción general también debe ser 1: 1, independientemente de cuáles sean las frecuencias relativas de los órdenes de nacimiento en la población.

whuber
fuente
Interesante; Esto parece deberse a que, aunque ninguna regla puede cambiar la proporción de la proporción natural, puede cambiar el número de hijos resultantes y ese número de hijos depende de la proporción natural. Entonces, en su ejemplo, tiene dos poblaciones de padres y se ven afectados de manera diferente. (Dicho esto, esto se siente como una situación fuera del alcance del país ficticio implícito que es más un ejercicio matemático)
Richard Tingle
pi1/21
1
ni debes disculparte, este es un resultado muy interesante (realmente pensé wow cuando lo leí). Simplemente lo preferiría en la forma "Resultado original", "Situación más realista". La forma en que está escrito se siente como hacer trampa (lo cual es injusto porque como digo es muy interesante) porque podría decir con la misma facilidad "Bueno, obviamente no es 1: 1 porque los nacimientos masculinos son más comunes" (creo que debido a nuestras inquietudes históricas morir en un conflicto armado)
Richard Tingle
pi0.51
@whuber Gracias por la respuesta informativa. Sin embargo, no entiendo por qué en su cálculo divide a la población en 2 familias con diferentes probabilidades de dar a luz a niñas. Según el punto 1 de su suposición de modelo, el p_i debería ser el mismo para todas las familias. Entonces, ¿por qué dividiste a la población en 2 tipos de familias?
Mobius Pizza
14

El nacimiento de cada niño es un evento independiente con P = 0.5 para un niño y P = 0.5 para una niña. Los otros detalles (como las decisiones familiares) solo lo distraen de este hecho. La respuesta, entonces, es que la relación es 1: 1 .

Para exponer sobre esto: imagine que en lugar de tener hijos, está lanzando una moneda justa (P (cara) = 0.5) hasta obtener una "cara". Digamos que la Familia A lanza la moneda y obtiene la secuencia de [colas, colas, caras]. Entonces la familia B lanza la moneda y obtiene una cola. Ahora, ¿cuál es la probabilidad de que el próximo sea cara? Todavía 0.5 , porque eso es lo que significa independiente . Si tuviera que hacer esto con 1000 familias (lo que significa que surgieron 1000 caras), el número total esperado de colas es 1000, porque cada giro (evento) fue completamente independiente.

Algunas cosas no son independientes, como la secuencia dentro de una familia: la probabilidad de la secuencia [cabezas, cabezas] es 0, no igual a [colas, colas] (0.25). Pero como la pregunta no es sobre esto, es irrelevante.

Tim S.
fuente
3
Como se dijo, esto es incorrecto. Si los géneros fueran incondicionalmente independientes, a la larga habría tantas secuencias de niñas y niñas en los nacimientos entre las familias como secuencias de niños y niñas. Hay muchos de estos últimos y nunca ninguno de los primeros. Hay una forma de independencia, pero está condicionada al orden de nacimiento.
whuber
1
@whuber No se nos pregunta cuántas secuencias de niñas hay. Solo la proporción de niñas a niños. No dije que la secuencia de nacimientos de una madre individual es una serie de eventos independientes, como lanzamientos de monedas. Solo que cada nacimiento, individualmente, es un evento independiente.
Tim S.
Tendrá que ser mucho más claro al respecto. Mencioné las secuencias para demostrar la falta de independencia, por lo que la carga recae sobre usted para indicar exactamente en qué sentido riguroso se aplica aquí la "independencia".
whuber
@whuber Los eventos son independientes de la misma manera que los lanzamientos de monedas son. He expuesto esto en mi respuesta.
Tim S.
3
@whuber las secuencias chica-chica aparecen si pones todos los nacimientos en línea; después de que una pareja termina la próxima entrada, etc., etc.
Richard Tingle
6

Imagine tirar una moneda justa hasta que observe una cabeza. ¿Cuántas colas arrojas?

P(0 tails)=12,P(1 tail)=(12)2,P(2 tails)=(12)3,...

El número esperado de colas se calcula fácilmente * para que sea 1.

El número de cabezas es siempre 1.

* si esto no está claro para usted, vea el 'resumen de la prueba' aquí

Glen_b
fuente
6

Las parejas con exactamente una niña y sin niños son las más comunes

La razón por la que todo esto funciona es porque la probabilidad del único escenario en el que hay más niñas es mucho mayor que los escenarios en los que hay más niños. Y los escenarios donde hay muchos más niños tienen probabilidades muy bajas. La forma específica en que funciona se ilustra a continuación

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

Puedes ver más o menos a dónde va esto en este momento, el total de las niñas y los niños sumarán uno.

Chicas esperadas de una pareja=n=1(12n)=1
=n=1(n1n2)=1

Limitar soluciones de wolfram

Cualquier nacimiento, cualquiera que sea la familia, tiene una probabilidad de 50:50 de ser niño o niña.

Todo esto tiene sentido intrínseco porque (por más que lo intenten las parejas) no se puede controlar la probabilidad de que un nacimiento específico sea un niño o una niña. No importa si un niño nace de una pareja sin hijos o de una familia de cien niños; la probabilidad es de 50:50, por lo que si cada nacimiento individual tiene una probabilidad de 50:50, siempre debe tener la mitad de niños y la mitad de niñas. Y no importa cómo barajes los nacimientos entre familias; no vas a afectar eso.

Esto funciona para cualquier regla 1

Debido a la posibilidad de 50:50 de cualquier parto, la proporción terminará en 1: 1 para cualquier regla (razonable 1 ) que se te ocurra. Por ejemplo, la siguiente regla similar también funciona incluso

Las parejas dejan de tener hijos cuando tienen una niña o tienen dos hijos

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

En este caso, el total de hijos esperados se calcula más fácilmente

Chicas esperadas de una pareja=0.51+0.251=0.75
=0.251+0.252=0.75

1 Como dije, esto funciona para cualquier regla razonable que pueda existir en el mundo real. Una regla irrazonable sería aquella en la que los hijos esperados por pareja eran infinitos. Por ejemplo, "Los padres solo dejan de tener hijos cuando tienen el doble de niños que de niñas", podemos usar las mismas técnicas que antes para mostrar que esta regla les da a los niños infinitos:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Entonces podemos encontrar el número de padres con un número finito de hijos

Número esperado de padres con hijos finitos=m=1(11/(3m)2)=π254=0.18277.

Limitar soluciones de wolfram

Entonces, de eso podemos establecer que el 82% de los padres tendrían un número infinito de hijos; desde el punto de vista de la planificación urbana, esto probablemente causaría dificultades y demuestra que esta condición no podría existir en el mundo real.

Richard Tingle
fuente
3
Es evidente que los nacimientos no son independientes al examinar las secuencias de nacimientos: la secuencia niña-niña nunca aparece mientras que las secuencias niño-niño ocurren con frecuencia.
whuber
1
@whuber Entiendo su punto de vista (aunque podría decirse que es la decisión de tener un hijo lo que depende, en lugar del resultado del evento en sí), posiblemente sería mejor decir "la probabilidad de un niño de ser un niño en el futuro es independiente" de todos los nacimientos pasados ​​"
Richard Tingle
Sí, creo que hay una manera de rescatar el uso de la independencia aquí. Pero creo que esto lleva, creo, al meollo del asunto, por lo que parece que para honrar la solicitud del OP de una demostración "vigorosa" (¿rigurosa?) Se necesita un razonamiento cuidadoso sobre este tema.
whuber
@whuber Para ser honesto, el primer párrafo es el bit de transmisión manual, los párrafos adicionales (y específicamente los límites) se supone que son el bit riguroso
Richard Tingle
No hay argumentos allí, pero el último material ya se ha cubierto de la misma manera en las respuestas en stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 y stats.stackexchange.com/a/93841 .
whuber
5

También puedes usar la simulación:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio
Aghila
fuente
1
Los resultados de la simulación son buenos, ya que pueden darnos un poco de consuelo, no hemos cometido un error grave en una derivación matemática, pero están lejos de la demostración rigurosa solicitada. En particular, cuando pueden ocurrir eventos raros que contribuyen mucho a una expectativa (como una familia con 20 niños antes de que aparezca una niña, que es muy poco probable que surja en una simulación de solo 10,000 familias), entonces las simulaciones pueden ser inestables o incluso mal, no importa cuánto tiempo se repiten.
whuber
Reconocer la distribución geométrica de # de niños en la familia es el paso clave para este problema. Prueba:mean(rgeom(10000, 0.5))
AdamO
5

Mapear esto me ayudó a ver mejor cómo la proporción de la población de nacimiento (se supone que es 1: 1) y la proporción de la población de niños sería de 1: 1. Si bien algunas familias tendrían varios niños pero solo una niña, lo que inicialmente me llevó a pensar que habría más niños que niñas, el número de esas familias no sería mayor al 50% y disminuiría a la mitad con cada niño adicional, mientras que el número de familias de una sola niña sería del 50%. El número de niños y niñas se equilibrarían entre sí. Vea los totales de 175 en la parte inferior. Relación de niños

Lowe Rudd
fuente
2

Lo que obtuviste fue la respuesta más simple y correcta. Si la probabilidad de que un niño recién nacido sea un niño es p, y los accidentes desafortunados no satisfacen a los niños del género incorrecto, entonces no importa si los padres toman decisiones sobre tener más hijos en función del género del niño. Si el número de niños es N y N es grande, puede esperar sobre p * N niños. No hay necesidad de un cálculo más complicado.

Ciertamente hay otras preguntas, como "¿cuál es la probabilidad de que el hijo menor de una familia con hijos sea un niño" o "cuál es la probabilidad de que el hijo mayor de una familia con hijos sea un niño". (Uno de estos tiene una respuesta correcta simple, el otro tiene una respuesta incorrecta simple y obtener una respuesta correcta es complicado).

gnasher729
fuente
2

Dejar

Ω={(G),(B,G),(B,B,G),}

ser el espacio muestral y dejar

X: ΩRω|ω|-1

ωE(X)

E(X)=n=1(n-1)0.5n=1

Trivialmente, el valor esperado de las niñas es 1. Entonces, la proporción también es 1.

usuario3451767
fuente
2

Es una pregunta capciosa. La relación se mantiene igual (1: 1). La respuesta correcta es que no afecta la proporción de nacimientos, pero sí afecta el número de hijos por familia con un factor limitante de un promedio de 2 nacimientos por familia.

Este es el tipo de pregunta que puede encontrar en una prueba de lógica. La respuesta no es sobre la proporción de nacimientos. Eso es una distracción.

Esta no es una pregunta de probabilidad, sino una pregunta de razonamiento cognitivo. Incluso si respondiste una proporción de 1: 1, aún fallaste la prueba.

Andrew - OpenGeoCode
fuente
Recientemente edité mi respuesta para mostrar que la solución no es necesariamente 1: 1, lo que controvertía explícitamente sus afirmaciones.
whuber
Leí tu respuesta. Ha introducido un predicado que no se menciona en el problema (variación en la tasa de natalidad de las mujeres). No hay nada en el problema que afirme que la República Zorganiana es representativa de la población humana o incluso de los humanos.
Andrew - OpenGeoCode
1
Eso es correcto, pero tampoco hay nada que justifique la suposición demasiado simplificada de que todas las probabilidades de nacimiento son iguales. Deben hacerse suposiciones para proporcionar una respuesta objetiva y defendible, por lo que, como mínimo, una buena respuesta será explícita sobre las suposiciones que hace y proporcionará apoyo para esas suposiciones. Afirmar que "esta no es una pregunta de probabilidad" no aborda los problemas, pero los pasa por alto por completo.
whuber
@whuber: la proporción de nacimientos en este problema es invariante. La variante del problema es el número de nacimientos por familia. La pregunta es una distracción, no es parte del problema. <br/> El pensamiento lateral, es la capacidad de pensar creativamente, o "fuera de la caja", como a veces se hace referencia en los negocios, para usar su inspiración e imaginación para resolver problemas al mirarlos desde perspectivas inesperadas. El pensamiento lateral implica descartar lo obvio, dejar atrás los modos de pensamiento tradicionales y desechar las ideas preconcebidas. [FYI> Soy un científico principal en el laboratorio]
Andrew - OpenGeoCode
1
Entonces, es posible que haya pasado por alto un punto clave en mi respuesta: sus suposiciones también mantienen la probabilidad promedio de la población de que una mujer nazca invariante en 1: 1 (de una manera específica que espero se describiera claramente). Sostendría que hay un "pensamiento lateral" sustancial involucrado en cualquier resolución de una paradoja en la que los supuestos son examinados críticamente: se requiere imaginación y buenas habilidades analíticas para ver que uno está haciendo supuestos en primer lugar. Descartar cualquier pregunta directamente como un simple "truco", como lo hace aquí, parecería antitético para promover o celebrar tal pensamiento.
whuber
2

Estoy mostrando el código que escribí para una simulación de Monte Carlo (familias 500x1000) usando el software 'MATLAB'. Examine el código para que no me equivoque.

El resultado se genera y se representa a continuación. Muestra que la probabilidad simulada de nacimiento de niñas tiene muy buena concordancia con la probabilidad de nacimiento natural subyacente, independientemente de la regla de detención para un rango de probabilidad de nacimiento natural.

ingrese la descripción de la imagen aquí

Jugando con el código es más fácil entender un punto que no había entendido antes --- como señala otro, la regla de detención es una distracción. La regla de detención solo afecta el número de familias que reciben una población fija o, desde otro punto de vista, el número de nacimientos de niños dado un número fijo de familias. El género está determinado únicamente por el lanzamiento de dados y, por lo tanto, la proporción o probabilidad (que es independiente del número de hijos) dependerá únicamente del niño natural: el nacimiento de la niña.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])
Pizza Mobius
fuente
2

ithXi0.5

E[iXi]=iE[Xi]=0.5nn

E[i(1Xi)]=iE[1Xi]=0.5n

La independencia de los nacimientos es irrelevante para el cálculo de los valores esperados.


A propósito de la respuesta de @ whuber, si hay una variación de la probabilidad marginal entre familias, la proporción se sesga hacia los niños, debido a que hay más niños en familias con mayor probabilidad de niños que familias con una probabilidad más baja, lo que tiene un efecto aumentativo de La suma del valor esperado para los niños.

Innuo
fuente
2

Independientemente también programé una simulación en matlab, antes de ver lo que otros han hecho. Estrictamente hablando, no es un MC porque solo ejecuté el experimento una vez. Pero una vez es suficiente para obtener resultados. Esto es lo que produce mi simulación. No tomo una posición sobre la probabilidad de que los nacimientos sean p = 0.5 como primitivos. Dejo que la probabilidad de nacimiento varíe en un rango de Pr (Niños = 1) = 0.25: 0.05: 0.75.

Mis resultados muestran que a medida que la probabilidad se desvía de p = 0.5, la proporción de sexos es diferente de 1: en la expectativa, la proporción de sexos es simplemente la proporción de la probabilidad del nacimiento de un niño a la probabilidad del nacimiento de una niña. Es decir, esta es una variable aleatoria geométrica identificada previamente por @ månst. Esto es lo que creo que el póster original intuía.

Mis resultados imitan de cerca lo que ha hecho el póster anterior con el código matlab, haciendo coincidir las proporciones de sexo en las probabilidades de 0,45, 0,50 y 0,55 de que nazca un niño. Presento el mío mientras adopto un enfoque ligeramente diferente para obtener los resultados con un código más rápido. Para realizar la comparación, omití la sección de código vec = vec (randperm (s, N)) ya que s no está definido en su código y no sé la intención original de esta variable (esta sección de código también parece superflua, como originalmente fijado).

Publico mi código

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

Se espera el siguiente gráfico dada la fuerte ley del gran número. Lo reproduzco, pero el gráfico que importa es el segundo gráfico.

ingrese la descripción de la imagen aquí

Aquí, una probabilidad de población diferente a 0.5 para el nacimiento de cualquier sexo de un niño alterará la proporción de sexos en la población general. Suponiendo que los nacimientos son independientes (pero no la opción de seguir reproduciéndose), en cada ronda de reproducción condicional, la probabilidad de la población gobierna la composición general de los resultados de los nacimientos de niños y niñas. Entonces, como otros han mencionado, la regla de detención en el problema es intrascendente para el resultado de la población, como lo respondió el afiche que identificó esto como la distribución geométrica.

ingrese la descripción de la imagen aquí

Para completar, lo que afecta la regla de detención es el número de rondas de reproducción en la población. Como solo ejecuté el experimento una vez, el gráfico es un poco irregular. Pero la intuición está ahí: para un tamaño de población dado, a medida que aumenta la probabilidad del nacimiento de una niña, vemos que las familias necesitan menos rondas de reproducción para obtener la niña deseada antes de que toda la población deje de reproducirse (obviamente, el número de rondas dependerá de tamaño de la población, ya que aumenta mecánicamente la probabilidad de que una familia tenga, por ejemplo, 49 niños antes de tener su primera niña)

ingrese la descripción de la imagen aquí

La comparación entre mis proporciones de sexo calculadas:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

y los del póster anterior con el código matlab:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

Son resultados equivalentes.

Alberto Ramírez
fuente
1

Depende de la cantidad de familias.

Xp=0.5

P(X=x)=0.5x,x=1,2,3...
E(X)=2

N

NXi

Xi/NE(X)=2N

TT=XiT

P(T=t)=CN1t10.5t,t=N,N+1...

E[NXi]=E[NT]=t=NNtCN1t10.5t=2F1(N,1,N+1,1)
2F1

2F1(N,1,N+1,1)

Randy Lai
fuente