En los foros de nombres de bebés, los futuros padres repiten alguna versión de su Miedo a Jennifer todo el tiempo: "No quiero que mi hijo sea uno de los 5 en su clase con su nombre". La cosa es que ningún nombre se acerca a ese tipo de popularidad, e incluso en el apogeo de la moda de Jennifer, no obtuviste cinco de ellos en una clase. Quisiera algún tipo de respuesta para estos padres de cuán improbable sería una coincidencia de repetición de nombres.
Utilizando la extensa información de nombres de bebés de la Administración del Seguro Social ( https://www.ssa.gov/oact/babynames/limits.html ), ¿alguien puede decirme cómo calcular las posibilidades de que una clase de escuela primaria en los EE. UU. Tenga cinco niños con el mismo nombre? (Por simplicidad, por "mismo nombre" me refiero a la misma ortografía, y por "clase escolar" me refiero a que todos los niños nacieron en el mismo año). No estoy especificando un tamaño de clase, pero definitivamente debería ser mayor que 4 . :-)
fuente
Respuestas:
Todos los datos se pueden encontrar aquí . Cada valor en la tabla representa la probabilidad de que, dada una muestra de 25 personas de ese lugar y año de nacimiento, 5 de ellos compartan un nombre.
Método : utilicé el PDF binomial en cada nombre para encontrar la probabilidad de que cualquier clase de 25 personas tenga 5 personas que compartan un nombre:
Por ejemplo, si hay un total de 4,000,000 niños y 21,393 Emily's, entonces la probabilidad de que haya 5 Emily's en cualquier clase con 25 estudiantes es Binomial (25, 5, 0.0053) = 0.0000002. Sumar todos los nombres no da una respuesta exacta, porque según el Principio de Inclusión / Exclusión , también debemos tener en cuenta la posibilidad de tener múltiples grupos de 5 personas que compartan nombres. Sin embargo, dado que estas probabilidades son prácticamente nulas para todos los fines prácticos, he asumido que son insignificantes y, por lo tanto, .P(⋃Ai)≈∑P(Ai)
Actualización: como señalaron muchas personas, existe una considerable variación en el tiempo y entre los estados. Así que ejecuté el mismo programa, ESTADO POR ESTADO, y con el tiempo. Estos son los resultados (la probabilidad nacional es roja, los estados individuales son negros):
Curiosamente, Vermont (mi estado natal) ha sido siempre uno de los lugares más probables para que esto suceda en las últimas décadas.
fuente
consulte el siguiente script de Python para Python2.
La respuesta está inspirada en la respuesta de David C.
Mi respuesta final sería la probabilidad de encontrar al menos cinco Jacobs en una clase, siendo Jacob el nombre más probable según los datos de https://www.ssa.gov/oact/babynames/limits.html "Datos nacionales "desde 2006.
La probabilidad se calcula de acuerdo con una distribución binomial con la probabilidad de Jacob como la probabilidad de éxito.
Max. probabilidad de al menos cinco niños con el mismo nombre de 25: 4.7e-07 para el nombre Jacob
Max. probabilidad de al menos cinco niños con el mismo nombre de 50: 1.6e-05 para el nombre de Jacob, por supuesto.
Max. probabilidad de al menos cinco niños con el mismo nombre de 100: 0.00045 para el nombre de Jacob, por supuesto.
Por un factor de 10 el mismo resultado que el de David C. Gracias. (Mi respuesta no suma todos los nombres, debería discutirse)
fuente