En otras palabras, según lo siguiente, ¿qué es p?
Para hacer de esto un problema matemático en lugar de antropología o ciencias sociales, y para simplificar el problema, suponga que los compañeros se seleccionan con la misma probabilidad en toda la población, excepto que los hermanos y primos hermanos nunca se aparean, y los compañeros siempre se seleccionan del mismo Generacion.
- - población inicial
- - el número de generaciones.
- - el número promedio de hijos por pareja. (Si es necesario para la respuesta, suponga que cada pareja tiene exactamente el mismo número de hijos).
- : el porcentaje de personas que no tienen hijos y que no se consideran parte de una pareja.
- - población en la generación final. (Ya sea o , y (creo) que se puede calcular el otro).
- - probabilidad de que alguien en la generación final sea descendiente de una persona en particular en la generación inicial.
Estas variables pueden modificarse, omitirse o agregarse, por supuesto. Asumo por simplicidad que y no cambian con el tiempo. Me doy cuenta de que esto tendrá un muy estimación aproximada, pero es un punto de partida.
Parte 2 (sugerencia para futuras investigaciones):
¿Cómo puede considerar que los compañeros no se seleccionan con una probabilidad globalmente uniforme? En realidad, es más probable que los compañeros tengan la misma área geográfica, antecedentes socioeconómicos, raza y antecedentes religiosos. Sin investigar las probabilidades reales de esto, ¿cómo entrarían en juego las variables para estos factores? ¿Qué tan importante sería esto?
homework
etiqueta. Es mejor para todos los involucrados dejar que el OP haga eso. Puede que te interese este metahilo si aún no lo has visto.Respuestas:
Debido a que esta pregunta está recibiendo respuestas que varían desde astronómicamente pequeñas hasta casi el 100%, me gustaría ofrecer una simulación que sirva como referencia e inspiración para soluciones mejoradas.
Yo llamo a estas "tramas de llamas". Cada uno documenta la dispersión del material genético dentro de una población a medida que se reproduce en generaciones discretas. Las tramas son conjuntos de segmentos verticales delgados que representan personas. Cada fila representa una generación, con la inicial en la parte superior. Los descendientes de cada generación están en la fila inmediatamente debajo de ella.
Al principio, solo una persona en una población de tamaño está marcada y trazada en rojo. (Es difícil de ver, pero siempre se trazan a la derecha de la fila superior). Sus descendientes directos también se dibujan en rojo; aparecerán en posiciones completamente aleatorias. Otros descendientes se trazan como blancos. Debido a que el tamaño de la población puede variar de una generación a la siguiente, se usa un borde gris a la derecha para llenar el espacio vacío.n
Aquí hay una serie de 20 resultados de simulación independientes.
El material genético rojo finalmente se extinguió en nueve de estas simulaciones, dejando sobrevivientes en los 11 restantes (55%). (En un escenario, en la parte inferior izquierda, parece que toda la población finalmente se extinguió). Sin embargo, dondequiera que hubo sobrevivientes, casi toda la población contenía el material genético rojo. Esto proporciona evidencia de que la posibilidad de que un individuo seleccionado al azar de la última generación que contenga el gen rojo sea aproximadamente el 50%.
La simulación funciona determinando aleatoriamente una supervivencia y una tasa media de natalidad al comienzo de cada generación. La supervivencia se obtiene de una distribución Beta (6,2): promedia el 75%. Este número refleja la mortalidad antes de la edad adulta y las personas que no tienen hijos. La tasa de natalidad se extrae de una distribución Gamma (2.8, 1), por lo que promedia 2.8. El resultado es una historia brutal de capacidad reproductiva insuficiente para compensar la mortalidad generalmente alta. Representa un modelo extremadamente pesimista, el peor de los casos, pero (como he sugerido en los comentarios) la capacidad de crecimiento de la población no es esencial. Lo único que importa en cada generación es la proporción de rojo dentro de la población.
Para modelar la reproducción, la población actual se reduce a los sobrevivientes al tomar una muestra aleatoria simple del tamaño deseado. Estos supervivientes se emparejan aleatoriamente (cualquier superviviente que quede después del emparejamiento no puede reproducirse). Cada pareja produce un número de niños extraídos de una distribución de Poisson cuya media es la tasa de natalidad de la generación. Si alguno de los padres contiene el marcador rojo, todos los hijos lo heredan: esto modela la idea de descendencia directa a través de cualquiera de los padres.
Este ejemplo comienza con una población de 512 y ejecuta la simulación durante 11 generaciones (12 filas, incluido el inicio). Las variaciones de esta simulación que comienzan con tan solo y hasta 2 14 = 16 , 384 personas, utilizando diferentes cantidades de supervivencia y tasas de natalidad, todas exhiben características similares: al final de log 2 ( n ) generaciones (nueve en este caso), hay una probabilidad de 1/3 de que todo el rojo se haya extinguido, pero si no es así, la mayoría de la población es roja. Dentro de dos o tres generaciones más, casi toda la población es roja y seguirá siendo roja (o de lo contrario la población desaparecerá por completo).n=8 214=16,384 log2(n)
Por cierto, una supervivencia del 75% o menos en una generación no es fantasiosa. A finales de 1347, las ratas infestadas de peste bubónica se abrieron camino desde Asia a Europa; Durante los siguientes tres años, entre el 10% y el 50% de la población europea murió como resultado. La peste recurrió casi una vez por generación durante cientos de años después (pero generalmente no con la misma mortalidad extrema).
Código
La simulación fue creada con Mathematica 8:
fuente
randomPairs
ynext
en datos de pruebas, sus funciones deben ser evidentes. Observe el uso deNestList
iterarnext
para producir varias generaciones.¿Qué sucede cuando intentas contar antepasados?
Tienes 2 padres, 4 abuelos, 8 bisabuelos, ... Así que si regresas generaciones, entonces tienes 2 n antepasados. Supongamos una duración promedio de generación de 25 años. Luego ha habido alrededor de 28 generaciones desde 1300, lo que nos da unos 268 millones de antepasados en ese momento.n 2n 25 28
Este es el estadio correcto, pero hay algo mal con este cálculo, porque la población de la Tierra en 1300 no se mezcló de manera uniforme, e ignoramos los matrimonios mixtos dentro de su "árbol" ancestral, es decir, estamos contando dos veces a algunos antepasados.
Aún así, creo que esto puede conducir a un límite superior correcto en la probabilidad de que la persona elegida al azar en 1300 sea su antepasado al tomar la proporción a la población en 1300228
fuente
Cuanto más retrocedas, más probable es que estés relacionado con una persona que transmitió con éxito sus genes que vivieron en ese momento. De los 1/4 billones de antepasados que tienes que vivieron en 1300, muchos de ellos aparecerían cientos (si no miles, millones) de veces en tu árbol genealógico. La deriva genética y la cantidad de veces que estamos directamente relacionados con alguien son probablemente más relevantes para las diferencias en nuestro código genético que quienes fueron nuestros antepasados.
fuente
La probabilidad es = 1-z, cada descendiente en este problema está relacionado con los antepasados anteriores. Cualquiera que sea la tasa inicial de reproducción (1-z) es su probabilidad de ser descendiente de alguien en la población inicial. La probabilidad de estar vivo en la población final es solo la probabilidad incierta.
Estoy de acuerdo con la respuesta de Erad, aunque ahora creo que responde a una pregunta que no se hizo, a saber, cuál es la probabilidad de que estés vivo, dadas ciertas limitaciones reproductivas y de población conocidas para tus portadores.
fuente
Mi respuesta corta actualizada es:
La respuesta explicada:
dada una persona en particular hoy, es seguro que son descendientes de al menos 2 personas en 1300.
Cuando se elige a una persona en particular en 1300, existe la posibilidad (1-z) de que esa persona nunca se reproduzca, y el otro término es para el número de 'parejas de padres' y la probabilidad de que la persona esté relacionada con esta pareja (1 / número de parejas)
El (1-z) termina cancelando, dejándonos con
Lets plug in some numbers as an example. For assumptions, I use:
g = 28 (25-year generations between 1300 and 2011)
n = 360M (world population estimate in 1300 from wikipedia)
z = 0.2, c = 2.77=8 (not real data, but does end up with about 7B people in 2011)
Resulting in:
Thanks for reading, Erad
fuente
This is a very interesting question as it is asking us to mathematically solve a fractal. Such as the famous game of life.
The % of the population which each generation related to will grow over each iteration, starting atp1=2n1 and at the limit generation will approach limk→∞pk=(1−z) .
If we denotepk as the probability of someone in generation k to be related to the initial population. And for simplicity lets relax the siblings & cousins rule (can be added later). Then:
As each person in the new generation has exactly 2 ancestors in the initial population.
With each generation, the probability to be related to someone at the initial population will undoubtedly grow, but at a decreasing pace. This is because the probability to draw "relatives" which are coming from the same or similar tree will grow.
Lets use ethnicity as an example. Lets say we know for a fact someone is 100% Caucasian. At generation 28 he is most likely related to a significant portion of the Caucasian population in 1300 (As shown by @whuber simulation). Lets say he is marrying someone who is 100% of a different ethnicity. Their offspring will be linked to approximately double the number of people they are linked to from 1300.
Another interesting thought is that given the human (homosapien) race started from ~600 people in Africa, then we are most likely a genetic permutation of all of them who successfully mated.
fuente