¿Probabilidad de nacer en un día bisiesto?

31

Dado que hoy es un día bisiesto, ¿alguien sabe la probabilidad de nacer en un día bisiesto?

EstadísticasEstudiante
fuente
30
Tenga en cuenta que los nacimientos no se distribuyen de manera uniforme durante todo el año, por lo que la probabilidad de que un día elegido al azar sea un día bisiesto no es la misma que la probabilidad de nacer en uno.
Ben Millwood
17
¿De quién nace? ¿Todas las personas en la historia? ¿Hoy? ¿Todas las personas vivas? ¿Prospectivamente hacia el futuro? Las probabilidades no tienen sentido a menos que los eventos a los que se refieren estén bien definidos.
whuber
15
El 100% de las personas nacidas hoy lo serán. ¿Eso ayuda?
aslum
8
Muchos padres no quieren que sus hijos nazcan en el día bisiesto. Entonces, con el aumento de las cesáreas programadas, la probabilidad será menor que un día aleatorio. fivethirtyeight.com/features/…
James Lawruk
3
Estoy de acuerdo con @whuber, que la pregunta está mal definida. Sin una definición adecuada del espacio de probabilidad, la pregunta no puede responderse. De ahí el voto negativo.
mpiktas

Respuestas:

24

Seguro. Consulte aquí para obtener una explicación más detallada: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .

Pero esencialmente el autor concluye: "Hay 485 años bisiestos en 2 milenios. Entonces, en 2 milenios, hay días en total. De esos días, el 29 de febrero ocurre en 485 de ellos (los años bisiestos), por lo que la probabilidad es 485 / 730.485 mil = 0,0006639424 "485(366)+(2000485)(365)=730485485/730485=0.0006639424

EstadísticasEstudiante
fuente
99
¿Por qué no se puede calcular como 1 / (Número de días en 4 años) = 1/1461 = 0.00068 ?
Siddhesh
21
@Siddhesh Hay una regla con respecto a los siglos. Entonces, por ejemplo, 2100 no es un año bisiesto
Rentrop
8
@Siddhesh, desafortunadamente, no es tan simple. Los años bisiestos son un poco más complejos. La duración promedio de un año es, en promedio, 365,2425 días, no 365,25. Como está escrito en la página del año bisiesto de Wikipedia, "El calendario gregoriano ... elimina tres días bisiestos cada 400 años, que es la duración de su ciclo bisiesto. Esto se hace eliminando el 29 de febrero en los tres años del siglo (múltiplos de 100) eso no se puede dividir exactamente entre 400. [3] Los años 2000 y 2400 son años bisiestos, mientras que 1800, 1900, 2100, 2200, 2300 y 2500 son años comunes ".
StatsStudent
10
No veo por qué necesitas considerar 2000 años; los años bisiestos están en un ciclo de 400 años, entonces, ¿por qué no simplemente reducir a "hay 97 años bisiestos en 400 años"?
Philip Kendall
77
¿Por qué deberíamos considerar influencias menores como los días bisiestos "cancelados" en los años del siglo, no múltiplos de 400 pero, por otro lado, no tener en cuenta las influencias externas, como casi todos los nacimientos retrasados ​​o introducidos antes del 29 de febrero, solo para ahorrar el niño de la molestia (u otras razones)? - Al menos aquí en Alemania, la probabilidad de que ocurra un nacimiento el 29 de febrero es (estimada) casi cero.
Estoy con Mónica
23

Para predecir con precisión esa probabilidad utilizando estadísticas, sería útil saber dónde tuvo lugar el nacimiento.

Esta página http://chmullig.com/2012/06/births-by-day-of-year/ tiene un gráfico que muestra un subconjunto del número de nacimientos por día (multiplicando el 29 por 4, lo cual es incorrecto e indeseable para esta pregunta, pero también se vincula a los datos originales y ofrece una indicación aproximada de lo que puede esperar) en los Estados Unidos. Supongo que esta curva no es válida para otros países, y especialmente no para otros continentes. En particular, el hemisferio sur y la región ecuatorial pueden mostrar una derivación sustancial de estos resultados, suponiendo que el clima es un factor determinante.

Además, está el tema del "nacimiento electivo" (mencionado por los autores de http://bmjopen.bmj.com/content/3/8/e002920.full ) - en las regiones más pobres del mundo, esperaría un cambio diferente. distribución de nacimientos, simplemente porque las cesáreas (no de emergencia) o los nacimientos inducidos son más raros que en los países desarrollados. Esto sesga la distribución final de los nacimientos.

Utilizando los datos estadounidenses, suponiendo ~ 71 millones de nacimientos (media graficada aproximada * 366) y 46,000 nacimientos el 29 de febrero, sin corregir la distribución de los años bisiestos en los datos, porque el período preciso no está indicado, llego a una probabilidad de alrededor de ~ 0.000648. Esto está ligeramente por debajo del valor que cabría esperar dada una distribución plana de nacimientos y, por lo tanto, en línea con la impresión general dada por el gráfico.

Dejaré una prueba de importancia de esta estimación aproximada a un lector motivado. Pero dado que el 29 (aunque no corregido, el año 2000 inyecta un sesgo por debajo del promedio en los datos) tiene puntajes bajos incluso para los estándares ya bajos de febrero, supongo una confianza relativamente alta de que la hipótesis nula de distribución equitativa puede ser rechazada.

Rick Moritz
fuente
1
El conjunto de datos tiene fechas de nacimiento del 30 y 31 de febrero. Eso es gracioso. Necesita una buena limpieza antes del análisis, pero tiene muchos datos, lo cual es excelente.
Aksakal
22

Creo que la respuesta a esta pregunta solo puede ser empírica. Cualquier respuesta teórica sería errónea sin tener en cuenta los fenómenos de selección de cumpleaños, la estacionalidad, etc. Estas cosas son imposibles de abordar teóricamente.

Los datos de cumpleaños son difíciles de encontrar en los EE. UU. Por razones de privacidad. Hay un conjunto de datos anónimos aquí . Es de solicitudes de seguros en los Estados Unidos. La diferencia con otros informes, como un artículo popular del NYT que se cita con frecuencia , es que enumera la frecuencia de los nacimientos por fecha, en lugar de la simple clasificación de días en un año. El punto débil es, por supuesto, el sesgo de muestreo, ya que proviene del seguro: las personas sin seguro no están incluidas, etc.

Según los datos, el 29 de febrero hubo 325 nacimientos del total de 481040. Según Roy Murphy , la muestra abarca desde 1981 hasta 1994. Incluye 3 años bisiestos de un total de 14 años. Sin ningún ajuste, la probabilidad sería 0.0675% de haber nacido el 29 de febrero entre 1981 y 1994.

Se puede ajustar la probabilidad de que representa la frecuencia de los años bisiestos, que está cerca de 1/4 ( no exactamente, aunque ), por ejemplo, multiplicando este número por para llegar a 0,079% estimado. Aquí, la probabilidad condicional p de nacer el 29 de febrero en un año bisiesto está vinculada a la frecuencia observada F o = 325 por la frecuencia f L = 3 de los años bisiestos en una muestra: F o = f L / N F p , donde N = 1414/ /12pagsFo=325FL=3

Fo=FL/ /norteFpags,
norte=14es el número de años en una muestra, y es la frecuencia total de nacimientos.F=481040

Normalmente, la probabilidad de años bisiestos es , por lo tanto, la media a largo plazo de probabilidad P L de haber nacido el 29 de febrero es: P L = p Lp p LNpagsL1/ /4 4PAGSL

PAGSL=pagsLpagspagsLnorteFLFoF0,079%

Puede que le interese la probabilidad condicional de nacer el 29 de febrero dado que nació en año bisiesto: p = Npags

pags=norteFLFoF0,32%

Entonces, el vínculo entre y p se basa en algunos supuestos, por ejemplo, que la probabilidad de nacer en un año determinado es uniforme y no cambia.PAGSLpags

Por supuesto, esta discusión se centró en los Estados Unidos. Quién sabe cuáles son los patrones en otros países.

ACTUALIZACIÓN: Asumimos automáticamente que OP es un calendario gregoriano. Se vuelve aún más interesante si considera diferentes calendarios como el calendario lunar Hijri , donde los años bisiestos son cada 30 años más o menos.

ACTUALIZACIÓN 2:

pagsFpags=1,527Amitabh Chandra, Harvard University

Ahora, ¿qué tan probable es que esos días muy peculiares en el calendario gregoriano: 1 de enero, 25 de diciembre y 29 de diciembre lleguen al azar como los cumpleaños más populares? Digo que es muy poco probable que ocurra al azar. Por lo tanto, es aún más interesante ver lo que está sucediendo en otros calendarios como Hijri.

ACTUALIZACIÓN 3:

PAGSL,pags

pags^1/ /3660.27
PAGS^Lpags3663654 4+10,068

ACTUALIZACIÓN 4:

χ2

14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

SALIDA:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

ingrese la descripción de la imagen aquí

Aksakal
fuente
3
Es un análisis útil (+1). Me hace preguntarme qué conexión hay, si la hay, entre las frecuencias que analizas y la probabilidad (vagamente definida) solicitada en la pregunta.
whuber
1
@whuber, las probabilidades en mi respuesta son para casos como el análisis de aplicaciones de seguros o algunos datos de usuarios. Por ejemplo, tiene un sitio web y desea marcar datos problemáticos del usuario. Podrías comparar la frecuencia de los cumpleaños del 29 de febrero con mis probabilidades. Sin embargo, si está planeando una familia y haciendo esta pregunta, entonces mis números son inútiles, más o menos. La razón es que no tienen en cuenta factores tales como cuándo exactamente la pareja está realmente copulando o los patrones de fertilidad y período de las parejas, por ejemplo, que es el principal determinante de la fecha de nacimiento.
Aksakal
Me alegra ver que no comenzaste con las matemáticas antes de considerar otros factores, más allá de las estadísticas puras
TheBlastOne
8

La portada de mi libro favorito ofrece alguna evidencia muy relevante contra la suposición de una asignación uniforme de nacimientos a fechas. Específicamente, los nacimientos en los EE. UU. Desde 1970 exhiben varias tendencias superpuestas entre sí: una tendencia larga de varias décadas, una tendencia no periódica, tendencias del día de la semana, tendencias del día del año, tendencias de vacaciones (porque procedimientos como la cesárea la sección le permite a uno programar efectivamente la fecha de nacimiento, y los médicos a menudo no los hacen en días festivos). El resultado es que la probabilidad de nacer en un día elegido al azar en un año no es uniforme, y debido a que la tasa de natalidad varía entre años, tampoco todos los años son igualmente probables.

Esto también proporciona evidencia de que la solución de Asksal, aunque es un contendiente muy fuerte, también es incompleta. Un pequeño número de días bisiestos estará "contaminado" por todos los efectos en juego aquí, por lo que la estimación de Asksal también está capturando (por casualidad) el efecto del día de la semana y las tendencias a largo plazo junto con el 29 de febrero. efecto. Qué efectos son y no son apropiados para incluir no están claramente definidos por su pregunta.

Y este análisis solo tiene relación con los EE. UU., Que tiene tendencias demográficas que podrían ser bastante diferentes de otras naciones o poblaciones. La tasa de natalidad de Japón ha estado disminuyendo durante décadas, por ejemplo. La tasa de natalidad de China está regulada por el estado, con algunas consecuencias para la composición de género de su nación y, por lo tanto, las tasas de natalidad en las generaciones posteriores.

Del mismo modo, el análisis de Gelman solo describe varias décadas recientes, y no está necesariamente claro que esta sea incluso la era de interés para su pregunta.

ingrese la descripción de la imagen aquí

Para aquellos que se entusiasman con este tipo de cosas, el material de la portada se discute extensamente en el capítulo sobre procesos gaussianos.

Sycorax dice reinstalar a Mónica
fuente
2
Una breve descripción del modelo utilizado también está disponible en la publicación del blog aquí: andrewgelman.com/2012/06/19/…
Sakari Cajanus
3

El 29 de febrero es una fecha que ocurre cada año que es un múltiplo de 4 .

Sin embargo, los años que son múltiplos de 100 pero no uno de 400, no se consideran años bisiestos (por ejemplo: 1900 no es bisiesto, mientras que 2000 o 1600 sí lo son). Por lo tanto, hoy en día, es el mismo patrón cada 400 años.

Así que hagamos los cálculos en un [0; 400 [ intervalo:

En un período de 400 años, hay exactamente 4 x 25 = 100 años que son múltiplos de 4 . Pero tenemos que restar 3 (años múltiplo de 100 pero no de 400) de 100, y obtenemos 100 - 3 = 97 años.

Ahora tenemos que multiplicar 97 por 366, 97 x 366 = 35502 (número de días en un año bisiesto en un período de 400 años), permanece (365 x (400-97)) = 110 595 (número de días que no t en un año bisiesto en un período de 400 años).

Luego solo tenemos que sumar estos dos números para saber el número total de días en un período de 400 años: 110 595 + 35502 = 146 097 .

Para finalizar, nuestra probabilidad es el número del 29 de febrero en un período de 400 años, entonces 97 dado que hay 97 años bisiestos divididos por el número total de días de nuestro intervalo:

p = 97/146097 ≈ 0,0006639424492

Espero que esto sea correcto y claro.

Jonathan Poid
fuente
77
Este es un buen análisis de la posibilidad de que una fecha elegida al azar sea el 29 de febrero. Creo que la mayor parte de la discusión en este hilo se centra en el hecho de que esto realmente no responde preguntas sobre las posibilidades de nacimientos, que en realidad no se comportan como sorteos al azar del conjunto de días posibles.
whuber
1
Una manera mucho más fácil es decir que hay 97 años bisiestos por cada 400 años de la forma en que ya ha trabajado. Calcule el número de días en 400 años normales. 400 * 365 = 146000. Luego debe agregar los 97 días bisiestos dando 146097.
CJ Dennis
2

Creo que hay dos preguntas que se mezclan aquí. El primero es "¿Cuál es la probabilidad de que un día determinado sea un 29 de febrero?". El segundo es (y el que realmente preguntó) "¿Cuál es la probabilidad de nacer en un día bisiesto?"

El enfoque de simplemente contar días parece ser engañoso, ya que Aksakal lo señala. Contar los días y calcular las frecuencias del 29 de febrero ocurre la pregunta: "¿Cuál es la probabilidad de que un día determinado sea el 29 de febrero?" (Imagínese despertarse después de un coma, no tengo idea de qué día es. La probabilidad de que sea un 29 de febrero es como se señaló anteriormentepags=971460970 0,00066394)

Siguiendo la respuesta de Aksakal, la probabilidad solo puede basarse en estudios empíricos de la distribución de nacimientos a lo largo de los días del año. Diferentes conjuntos de datos llegarán a diferentes conclusiones (por ejemplo, debido a los efectos de la estacionalidad, las tendencias a largo plazo en las tasas de natalidad, las diferencias culturales). Aksakal señaló un estudio (Un comentario: para tener en cuenta la ocurrencia no representativa de un año bisiesto en los datos mencionados (es decir314) en comparación con la frecuencia a largo plazo de los años bisiestos (es decir, 97400) tendrías que multiplicar la frecuencia de nacimiento el 29 de febrero de la muestra por 97400143=6796001.131667)

Finalmente, hay una tercera interpretación posible de la pregunta, que creo que no fue pensada: "¿Cuál es la probabilidad de que una persona específica nazca en un día bisiesto?" Bueno, para cualquiera que haya nacido eso es fácil. Es cualquiera0 0 o 1. Para cualquier persona que no haya nacido pero que ya haya concebido, también puede estimarse mediante estudios empíricos sobre la duración del embarazo (consulte Wikipedia para obtener una descripción general ). Para cualquiera que aún no haya sido concebido, ver arriba.

entusiasta de datos
fuente
2
Errr, estaba listo para votar esto, y luego llegué a Bueno, para cualquiera que haya nacido, eso es fácil. Es 0 o 1. No.
mattdm
Supongo que esto depende un poco de la interpretación de las probabilidades. Supongamos que he lanzado una moneda. Lo miré y sé el resultado (por ejemplo, cabezas). Estás parado a mi lado, pero no has visto el resultado. ¿Cuál es la probabilidad de que la moneda muestre caras (para ti, para mí, "objetivamente")? En el ejemplo anterior: para la persona (nacida) dada, la probabilidad es 0 o 1 (suponiendo que sepa en qué fecha nace). Si elige a una persona al azar y tuvo que adivinar su cumpleaños, la probabilidad de que sea un 29 de febrero es una pregunta empírica.
data_enthusiast
1

Me he dado cuenta de que la mayoría de las respuestas anteriores resuelven esto calculando el número de días bisiestos en un período particular. Hay una manera más simple de obtener la respuesta, 100% precisa, por definición:

Utilizamos los años bisiestos para ajustar el calendario regular (365 días) al año tropical medio (también conocido como año solar medio). El año tropical medio "es el tiempo que tarda el Sol en volver a la misma posición en el ciclo de las estaciones, como se ve desde la Tierra" (Wikipedia). El año tropical varía ligeramente, pero el año tropical promedio (promedio) es aproximadamente 365.24667.

Si los días bisiestos son correctos, la posibilidad de que un día seleccionado al azar sea un día bisiesto es ((año tropical) - (año no bisiesto)) / año tropical

Agregando el número aproximado que tenemos, es (365.24667-365) /365.24667, o 0.24667 / 365.24667, o 675 por millón (0.0675%).

Esto, sin embargo, es para un día seleccionado al azar. Me imagino que esto es sustancialmente sesgado por los padres que prefieren no tener que explicarles a sus hijos, "su cumpleaños real solo llega una vez cada 4 años".

AMADANON Inc.
fuente
3
No creo que esto responda a la pregunta que se hace, porque el día bisiesto, 29 de febrero, solo existe en sistemas de calendario particulares. Esos sistemas de calendario solo se han utilizado en sociedades particulares durante las últimas eras históricas. Por ejemplo, esta pregunta no es inteligible para alguien que calcula el tiempo usando el calendario hebreo, que no tiene "febrero" en absoluto. Además, incluso si asumimos un calendario con un día bisiesto, aún no resuelve la indeterminación que rodea la distribución de probabilidad de nacimientos a días.
Sycorax dice Reinstate Monica
@ user777, eso es irrelevante. Si perteneces a una cultura que no reconoce el día bisiesto, todavía habrá personas que nazcan en nuestro día bisiesto.
Octopus
1
@ Octopus No si nacieron antes de octubre de 1582, el mes en que se introdujo el calendario gregoriano. La pregunta no es lo suficientemente específica como para permitir que uno pueda discernir qué poblaciones están siendo consideradas, razón por la cual mi comentario es críticamente relevante.
Sycorax dice Reinstate Monica
@ user777, estás dividiendo pelos. El punto es que el calendario gregoriano existe hoy y se puede usar para colocar cada día en la historia, lo hayan observado o no en ese momento.
Octopus
1
@ Octopus ¿Cómo sabes que ese es el punto?
Sycorax dice Reinstate Monica
-4

Le pregunté a mi hermana, cuyo cumpleaños es el 29 de febrero, y ella dijo: "El resultado de mi propio estudio empírico fue que obviamente es 1.00".

John Smith
fuente
Bueno, parece que no fue apreciado. Célebre.
John Smith