¿Qué posibilidades hay de que descienda de una persona en particular nacida en el año 1300?

26

En otras palabras, según lo siguiente, ¿qué es p?

Para hacer de esto un problema matemático en lugar de antropología o ciencias sociales, y para simplificar el problema, suponga que los compañeros se seleccionan con la misma probabilidad en toda la población, excepto que los hermanos y primos hermanos nunca se aparean, y los compañeros siempre se seleccionan del mismo Generacion.

$n_1$ - población inicial
$g$ - el número de generaciones.
$c$ - el número promedio de hijos por pareja. (Si es necesario para la respuesta, suponga que cada pareja tiene exactamente el mismo número de hijos).
$z$ : el porcentaje de personas que no tienen hijos y que no se consideran parte de una pareja.
$n_2$ - población en la generación final. (Ya sea $n_2$ o $z$ , y (creo) que se puede calcular el otro).
$p$ - probabilidad de que alguien en la generación final sea descendiente de una persona en particular en la generación inicial.

Estas variables pueden modificarse, omitirse o agregarse, por supuesto. Asumo por simplicidad que $c$ y $z$ no cambian con el tiempo. Me doy cuenta de que esto tendrá un muy estimación aproximada, pero es un punto de partida.

Parte 2 (sugerencia para futuras investigaciones):

¿Cómo puede considerar que los compañeros no se seleccionan con una probabilidad globalmente uniforme? En realidad, es más probable que los compañeros tengan la misma área geográfica, antecedentes socioeconómicos, raza y antecedentes religiosos. Sin investigar las probabilidades reales de esto, ¿cómo entrarían en juego las variables para estos factores? ¿Qué tan importante sería esto?

probability stochastic-processes genetics xpda
fuente

2

¿Es esta una pregunta de tarea? De lo contrario, ¿cuál es el contexto?

David LeBauer

1

@ John: Gracias por tu edición. Creo que el consenso predominante (en este sitio y en otros) es que no editamos preguntas simplemente para agregar la homeworketiqueta. Es mejor para todos los involucrados dejar que el OP haga eso. Puede que te interese este metahilo si aún no lo has visto.

cardenal

Tengo curiosidad. No soy estudiante y esta no es tarea de nadie. Solo bromeaba sobre el crédito extra, aunque puedo ver cómo implicaría tarea.

xpda

3

Para tener una idea inicial de las respuestas, considere la fracción

de la población que no está relacionada con un antepasado dado por descendencia. Inicialmente

para una población de

. Con una mezcla aleatoria,

se eleva al cuadrado después de cada generación. En una población inicial de

, digamos, esto implica que

es casi seguramente

después de

generaciones (aproximadamente

-

f

$f$

f = (n - 1) / n

$f = (n-1)/n$

n

$n$

f

$f$

n = 10^{8}

$n=10^8$

f

$f$

0

$0$

32

$32$

600

$600$

800

$800$ años).

whuber

1

Creo que hay algunas investigaciones académicas sobre la probabilidad de que un apellido único se extinga. Aunque no es idéntico al problema planteado, eso podría proporcionar una idea interesante (pero desafortunadamente no puedo recordar de dónde es). Por extraño que parezca, creo que esos estudios condujeron a una idea de las matemáticas detrás de la propagación de enfermedades infecciosas ...

Michael McGowan

13

Debido a que esta pregunta está recibiendo respuestas que varían desde astronómicamente pequeñas hasta casi el 100%, me gustaría ofrecer una simulación que sirva como referencia e inspiración para soluciones mejoradas.

Yo llamo a estas "tramas de llamas". Cada uno documenta la dispersión del material genético dentro de una población a medida que se reproduce en generaciones discretas. Las tramas son conjuntos de segmentos verticales delgados que representan personas. Cada fila representa una generación, con la inicial en la parte superior. Los descendientes de cada generación están en la fila inmediatamente debajo de ella.

Al principio, solo una persona en una población de tamaño está marcada y trazada en rojo. (Es difícil de ver, pero siempre se trazan a la derecha de la fila superior). Sus descendientes directos también se dibujan en rojo; aparecerán en posiciones completamente aleatorias. Otros descendientes se trazan como blancos. Debido a que el tamaño de la población puede variar de una generación a la siguiente, se usa un borde gris a la derecha para llenar el espacio vacío. $n$

Aquí hay una serie de 20 resultados de simulación independientes.

Parcelas de llamas

El material genético rojo finalmente se extinguió en nueve de estas simulaciones, dejando sobrevivientes en los 11 restantes (55%). (En un escenario, en la parte inferior izquierda, parece que toda la población finalmente se extinguió). Sin embargo, dondequiera que hubo sobrevivientes, casi toda la población contenía el material genético rojo. Esto proporciona evidencia de que la posibilidad de que un individuo seleccionado al azar de la última generación que contenga el gen rojo sea aproximadamente el 50%.

La simulación funciona determinando aleatoriamente una supervivencia y una tasa media de natalidad al comienzo de cada generación. La supervivencia se obtiene de una distribución Beta (6,2): promedia el 75%. Este número refleja la mortalidad antes de la edad adulta y las personas que no tienen hijos. La tasa de natalidad se extrae de una distribución Gamma (2.8, 1), por lo que promedia 2.8. El resultado es una historia brutal de capacidad reproductiva insuficiente para compensar la mortalidad generalmente alta. Representa un modelo extremadamente pesimista, el peor de los casos, pero (como he sugerido en los comentarios) la capacidad de crecimiento de la población no es esencial. Lo único que importa en cada generación es la proporción de rojo dentro de la población.

Para modelar la reproducción, la población actual se reduce a los sobrevivientes al tomar una muestra aleatoria simple del tamaño deseado. Estos supervivientes se emparejan aleatoriamente (cualquier superviviente que quede después del emparejamiento no puede reproducirse). Cada pareja produce un número de niños extraídos de una distribución de Poisson cuya media es la tasa de natalidad de la generación. Si alguno de los padres contiene el marcador rojo, todos los hijos lo heredan: esto modela la idea de descendencia directa a través de cualquiera de los padres.

Este ejemplo comienza con una población de 512 y ejecuta la simulación durante 11 generaciones (12 filas, incluido el inicio). Las variaciones de esta simulación que comienzan con tan solo y hasta personas, utilizando diferentes cantidades de supervivencia y tasas de natalidad, todas exhiben características similares: al final de generaciones (nueve en este caso), hay una probabilidad de 1/3 de que todo el rojo se haya extinguido, pero si no es así, la mayoría de la población es roja. Dentro de dos o tres generaciones más, casi toda la población es roja y seguirá siendo roja (o de lo contrario la población desaparecerá por completo). $n=8$ $2^{14} = 16,384$ $\log_2(n)$

Por cierto, una supervivencia del 75% o menos en una generación no es fantasiosa. A finales de 1347, las ratas infestadas de peste bubónica se abrieron camino desde Asia a Europa; Durante los siguientes tres años, entre el 10% y el 50% de la población europea murió como resultado. La peste recurrió casi una vez por generación durante cientos de años después (pero generalmente no con la misma mortalidad extrema).

Código

La simulación fue creada con Mathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

whuber
fuente

1

Creo que modelar así puede ser el mejor enfoque. Es mucho más simple y divertido (para mí) que las matemáticas, y debería hacer que sea mucho más fácil introducir factores que restrinjan la selección de pareja. ¿Tiene alguna recomendación, advertencia u otro consejo antes de sumergirme en esto?

xpda

3

@xpda Las soluciones matemáticas proporcionarán información sobre lo que importa y lo que no. Por ejemplo, mostrarán que no necesariamente necesita modelar grandes poblaciones. También indicarán el papel desempeñado por la variabilidad, que es más difícil de manejar analíticamente y se destaca en una simulación.

whuber

1

@whuber ¿Ejecutó la simulación en Mathematica? ¿Te importaría publicar código?

asumido el

1

@Max El código ahora está activo. Pido disculpas por la falta de comentarios. Si ejecuta cada uno de randomPairsy nexten datos de pruebas, sus funciones deben ser evidentes. Observe el uso de NestListiterar nextpara producir varias generaciones.

whuber

3

¿Qué sucede cuando intentas contar antepasados?

Tienes 2 padres, 4 abuelos, 8 bisabuelos, ... Así que si regresas generaciones, entonces tienes antepasados. Supongamos una duración promedio de generación de años. Luego ha habido alrededor de generaciones desde 1300, lo que nos da unos 268 millones de antepasados en ese momento. $n$ $2^n$ $25$ $28$

Este es el estadio correcto, pero hay algo mal con este cálculo, porque la población de la Tierra en 1300 no se mezcló de manera uniforme, e ignoramos los matrimonios mixtos dentro de su "árbol" ancestral, es decir, estamos contando dos veces a algunos antepasados.

Aún así, creo que esto puede conducir a un límite superior correcto en la probabilidad de que la persona elegida al azar en 1300 sea su antepasado al tomar la proporción a la población en 1300 $2^{28}$

vqv
fuente

2

Muy significativo teniendo en cuenta que gran parte de la población en ese entonces estaba bastante aislada entre sí, por lo que había muchas menos oportunidades para evitar los matrimonios mixtos.

dcl

2

Así que supongamos que el OP es de ascendencia inglesa y alrededor de 1300, la población de Inglaterra era de más de un millón. (Digamos antes de la gran hambruna). ¿Cómo cambiaría eso tu análisis?

dassouki

millones, no mil millones. Es el estadio correcto.

2^{28} \approx 268

$2^{28}\approx 268$

whuber

D'oh! Editó la respuesta. El cálculo todavía ignora matrimonios mixtos, pero esto podría dar una correcta límite superior de la probabilidad de que una persona elegido al azar en 1300 es su ancestro mediante la adopción de la fracción:

o

cien millones.

2^{28} / 3

$2^{28} / 3$

4

$4$

vqv

2

Cuanto más retrocedas, más probable es que estés relacionado con una persona que transmitió con éxito sus genes que vivieron en ese momento. De los 1/4 billones de antepasados que tienes que vivieron en 1300, muchos de ellos aparecerían cientos (si no miles, millones) de veces en tu árbol genealógico. La deriva genética y la cantidad de veces que estamos directamente relacionados con alguien son probablemente más relevantes para las diferencias en nuestro código genético que quienes fueron nuestros antepasados.

Tim
fuente

0

La probabilidad es = 1-z, cada descendiente en este problema está relacionado con los antepasados anteriores. Cualquiera que sea la tasa inicial de reproducción (1-z) es su probabilidad de ser descendiente de alguien en la población inicial. La probabilidad de estar vivo en la población final es solo la probabilidad incierta.

Estoy de acuerdo con la respuesta de Erad, aunque ahora creo que responde a una pregunta que no se hizo, a saber, cuál es la probabilidad de que estés vivo, dadas ciertas limitaciones reproductivas y de población conocidas para tus portadores.

Wipa
fuente

n_{1}

$n_1$

z

$z$

z

$z$

g

$g$

Además, para aclarar, la pregunta es encontrar la probabilidad de que una persona en particular en la generación final descienda de una persona en particular en la generación inicial.

xpda

1

A

$A$

A

$A$

A

$A$

A

$A$

@Wipa Descartes ' cogito, ergo sum sugiere fuertemente que la probabilidad de que esté vivo, dado cualquier restricción en mis antepasados es del 100% :-)

whuber

@whuber, tienes razón. Creo que estamos hablando del mismo problema. Lo que quería aclarar es que no estoy buscando la posibilidad de que alguien en la primera generación tenga un descendiente vivo en la última generación. Tenía miedo de que allí fue donde Wipa se le ocurrió (1-z) para la respuesta.

xpda

0

Mi respuesta corta actualizada es:

p > (1 - z) \times \frac{\frac{1}{n_{1} (1 - z)}}{2} = \frac{2}{n_{1}}

$p > {(1-z)} \times {{{1} \over {n_1(1-z)}} \over {2}} = {2 \over n_1}$

La respuesta explicada:
dada una persona en particular hoy, es seguro que son descendientes de al menos 2 personas en 1300.

Cuando se elige a una persona en particular en 1300, existe la posibilidad (1-z) de que esa persona nunca se reproduzca, y el otro término es para el número de 'parejas de padres' y la probabilidad de que la persona esté relacionada con esta pareja (1 / número de parejas)

El (1-z) termina cancelando, dejándonos con

p > \frac{2}{n_{1}}

$p > {2 \over n_1}$

n_{k + 1} = \frac{n_{k} (1 - z) \times c}{2} = \frac{n_{1} (1 - z)^{k} c^{k}}{2^{k}}

$n_{k+1} = {{n_k(1-z)\times c} \over 2} = {n_1(1-z)^kc^k \over 2^k}$

Lets plug in some numbers as an example. For assumptions, I use:
g = 28 (25-year generations between 1300 and 2011)
n = 360M (world population estimate in 1300 from wikipedia)
z = 0.2, c = 2.77=8 (not real data, but does end up with about 7B people in 2011)

Resulting in:

p > 2 / 360, 000, 000 = 5.56 \times 10^{- 9}

$p > 2 / 360,000,000 = 5.56 \times 10^{-9}$ or over one in 180M.

Thanks for reading, Erad

Erad
fuente

What is

c

$c$ ? And what is

z

$z$ ?

mpiktas

Based on the original question above: c = the average number of children per couple, and z = the percentage of people who have no children

Erad

2

Hm, how come your probability is less than

1 / n

$1/n$ =

1 / 360 M \approx 10^{- 9}

$1/360M\approx 10^{-9}$ ?

mpiktas

3

The answer given here holds for each member of the original population, no matter who they were. Summing over all members gives an upper bound for the probability that we are descended today from some person in the year 1300 of

360, 000, 000 / (2.66 \times 10^{249}) ≪ 1

$360,000,000 / (2.66 \times 10^{249}) \ll 1$ , which is obviously way wrong (unless alien clones were introduced along the way...).

whuber

1

@Erad In your comment you appear to assume that all of today's population is descended from a tiny fraction of the world in 1300. That's just not plausible. However, suppose for the sake of argument--and to examine an extreme case--that everyone today is known to have descended solely from one couple, "Adam" and "Eve", alive in 1300. Then the chance of descent is either 100% if Adam or Eve are the "particular person" of the question or else is 0%. This chance, averaged over the population in 1300, is still about

10^{- 8}

$10^{-8}$ , far higher than you compute.

whuber

0

This is a very interesting question as it is asking us to mathematically solve a fractal. Such as the famous game of life.

The % of the population which each generation related to will grow over each iteration, starting at $p_1={2 \over n_1}$ and at the limit generation will approach $\lim_{k \to \infty } p_k = (1-z)$ .

If we denote $p_k$ as the probability of someone in generation $k$ to be related to the initial population. And for simplicity lets relax the siblings & cousins rule (can be added later). Then:

p_{1} = \frac{2}{n_{1}}

$p_1 = {2 \over n_1}$

As each person in the new generation has exactly 2 ancestors in the initial population.

p_{2} = r e l a t i v e s \times \frac{2}{n_{2}} + n o n . r e l a t i v e s \times \frac{4}{n_{2}}

$p_2 = relatives \times {2 \over n_2} + non.relatives \times {4 \over n_2}$ In this case relatives could be calculated as:

r e l a t i v e s = \frac{(\binom{c}{2}) \times \frac{n}{c}}{(\binom{n}{2})} = \frac{c - 1}{n - 1}

$relatives = {\binom{c}{2} \times {n \over c} \over \binom{n}{2}} = {c-1 \over n-1}$ Or in other words, the number of sibling combinations, times the number of siblings family, divided by the total mating combinations.

p_{3} = i m m e d i a t e . r e l a t i v e s \times \frac{4}{n_{3}} + c o u s i n s \times \frac{6}{n_{3}} + n o n . r e l a t i v e s \times \frac{8}{n_{3}}

$p_3 = immediate.relatives \times {4 \over n_3} + cousins \times {6 \over n_3} + non.relatives \times {8 \over n_3}$

With each generation, the probability to be related to someone at the initial population will undoubtedly grow, but at a decreasing pace. This is because the probability to draw "relatives" which are coming from the same or similar tree will grow.

Lets use ethnicity as an example. Lets say we know for a fact someone is 100% Caucasian. At generation 28 he is most likely related to a significant portion of the Caucasian population in 1300 (As shown by @whuber simulation). Lets say he is marrying someone who is 100% of a different ethnicity. Their offspring will be linked to approximately double the number of people they are linked to from 1300.

Another interesting thought is that given the human (homosapien) race started from ~600 people in Africa, then we are most likely a genetic permutation of all of them who successfully mated.

Erad
fuente

¿Qué posibilidades hay de que descienda de una persona en particular nacida en el año 1300?

Respuestas:

Código