¿El hecho de que mi hijo italiano vaya a asistir a una escuela primaria cambiará el número esperado de niños italianos que estarán presentes en su clase?

37

Esta es una pregunta derivada de una situación de la vida real, por la cual me ha intrigado genuinamente su respuesta.

Mi hijo debe comenzar la escuela primaria en Londres. Como somos italianos, tenía curiosidad por saber cuántos niños italianos ya asisten a la escuela. Le pregunté esto al Oficial de Admisión durante la solicitud, y ella me dijo que tienen en promedio 2 niños italianos por clase (de 30).

Ahora estoy en el momento en que sé que mi hijo ha sido aceptado, pero no tengo otra información sobre los otros niños. Los criterios de admisión se basan en la distancia, pero para el propósito de esta pregunta, creo que podríamos asumir que se basa en la asignación aleatoria de una gran muestra de solicitantes.

¿Cuántos niños italianos se espera que estén en la clase de mi hijo? ¿Estará más cerca de 2 o 3?

usuario90213
fuente
39
Esto me recuerda a la vieja broma: "Siempre llevo una bomba cuando viajo, porque ¿cuáles son las probabilidades de que dos personas tengan una bomba en el mismo avión?"
Bill the Lizard
2
El hecho de que el oficial de admisión le haya dicho que tienen un promedio de 2 niños italianos por clase hace que esta información sea 'sospechosa' para mí. Si se derivara de un cálculo real, habría esperado un número no redondo. Entonces, es posible que el valor verdadero sea 1.51 o 2.49, digamos. Además, dado que es más probable que el Oficial de Admisión intente "complacerlo" con su respuesta, es posible que se hayan redondeado hacia arriba en lugar de hacia abajo (si pensaran que le agradaría tener a su hijo entre otros italianos), lo que sugiere que la probabilidad la distribución sobre valores cercanos a 2 sería no simétrica. Las respuestas a continuación se pueden adaptar.
PatrickT
44
@PatrickT "Modo" es un tipo válido de promedio.
Ian Ringrose
1
Muchas gracias chicos por responder. Ahora también publiqué una pregunta similar, pero con un marco diferente ( stats.stackexchange.com/questions/173969/… ), que ha sido activado por algunas de sus entradas / respuestas.
user90213
1
@PatrickT Creo que hay muchas más personas poco educadas que estarían confundidas por 1.5 ("¿Cómo tienes medio niño?") Que los empollones de estadísticas molestos por el redondeo excesivo me parece más probable. (Suponiendo que el número más preciso no sea realmente 1.9 o 2.1 de todos modos.)
Dan Neely

Respuestas:

27

Como siempre, debe considerar un modelo probabilístico que describa cómo la escuela distribuye a los niños entre las clases. Posibilidades:

  1. La escuela se encarga de que todas las clases tengan el mismo número de ciudadanos extranjeros.
  2. La escuela incluso trata de asegurarse de que cada nacionalidad esté representada más o menos igual en cada clase.
  3. La escuela no considera la nacionalidad en absoluto y solo distribuye al azar o en función de otros criterios.

Todo esto es razonable. Dada la estrategia 2, la respuesta a su pregunta es no. Cuando usan la estrategia 3, la expectativa será cercana a 3, pero un poco menor. Esto se debe a que su hijo ocupa un "puesto" y usted tiene una oportunidad menor de tener un italiano al azar.

Cuando la escuela usa la estrategia 1, la expectativa también aumenta; cuánto depende del número de extranjeros por clase.

Sin conocer tu escuela no hay forma de responder a esto más perfectamente. Si solo tiene una clase por año y los criterios de admisión son los descritos, la respuesta sería la misma que para 3 anteriores.

Calculando para 3 en detalle:

E(X)=1+E(B(29,2/30))=1+1.9333=2.9333.

X es el número de niños italianos en la clase. El 1 proviene del niño conocido, los 29 son el resto de la clase y 2/30 es la probabilidad de que un niño desconocido sea italiano dado lo que dice la escuela. B es la distribución binomial.

Tenga en cuenta que comenzar con no da la respuesta adecuada, ya que saber que un niño específico es italiano viola la intercambiabilidad asumida por la distribución binomial. Compare esto con la paradoja del niño o la niña , donde hace la diferencia si sabe que un niño es una niña versus saber que el niño mayor es una niña.E(X|X1)

Erik
fuente
2
Hagamos la suposición binomial y dejemos . Parece que la elección entre y puede depender de los supuestos. Por ejemplo, si supongo que cualquier padre italiano en Londres es muy probable que esté tan confundido como @ user90213 y luego va a publicar una pregunta aquí, entonces ver esta pregunta no altera mucho mis expectativas. Solo aprendí que un niño es italiano y calcularía . ¿Es lo que llamaste "intercambiabilidad"? Si, por otro lado, user90213 es mi amigo cercano y conozco a su hijo, llegaría a su respuesta. E ( X ~ B ( 30 , 2 / 30 ) | X 1 ) E ( B ( 29 , 2 / 30 ) ) E ( X | X 1 )n=30E(XB(30,2/30)|X1)E(B(29,2/30))E(X|X1)
ameba dice Reinstate Monica
2
@amoeba Saber que en una escuela específica y en una clase específica está el niño del usuario90213 es suficiente para distinguirlo del resto, no depende de cuán especial sea su relación con el usuario90213. Pero es complicado porque importa cómo aprendes la información. Por ejemplo, si solicita por correo electrónico que el niño italiano más viejo de una clase se comunique con usted por su nombre y reciba una respuesta, optará por el enfoque incluso si puede distinguir al niño después. Intenta buscar en Google la paradoja de las niñas o incluso haz una pregunta más general para eso. Hay mucha discusión al respecto. E(X|X>1)
Erik
Así es, gracias Erik. Lo que quise decir en el comentario anterior es algo similar a su ejemplo de correo electrónico. Si supongo que todos los padres italianos en una clase publicarán una pregunta aquí, entonces ver esta pregunta es exactamente como ser contactado por el hijo italiano más viejo. Parece que generalmente estamos de acuerdo, +1. El enlace wiki es realmente interesante.
ameba dice Reinstate Monica
(+1) Pero no sabes por qué dices "Si solo tienes una clase por año [...]".
Scortchi - Restablece a Monica
@Scortchi Si la escuela tiene solo una clase por año, entonces puede usar las dos estrategias denominadas 1 y 2, ya que cada niño que es aceptado en la escuela este año termina en la misma clase.
Erik
13

Otra forma de ver esto es a nivel de niños individuales. Suponiendo que los 30 niños extraídas al azar de una población (que Usted ha indicado podemos), podemos trabajar hacia atrás a la probabilidad aproximada de un niño italiano que se extrae de esta población: = 1 / 15 .2/301/15

Dado que sabemos que uno de los 30 es italiano, solo tenemos que calcular la probabilidad para los niños restantes:

291/15=29/15=1.933

Entonces, saber que su hijo es italiano cambia el número esperado de niños italianos en la clase a aproximadamente 2.933, que está mucho más cerca de 3 que de 2.

Thomas Cleberg
fuente
5

Aquí están mis pensamientos sobre cómo abordar esto:

Deje que la variable aleatoria denote el número de niños italianos en una clase que actualmente es de tamaño n . Sea X el indicador de que un nuevo niño sea italiano. Supongamos que agregamos X hijo a esta clase. Entonces, el número esperado de niños italianos en esta clase aumentada de tamaño n + 1 es E ( S n + X ) = E ( S n ) + E ( X ) = E ( S n ) + P (SnnXXn+1 . Tenga en cuenta que la independencia no importa aquí, ya que solo estamos utilizando la linealidad de la expectativa. Sise sabe que elniño X es italiano, entonces X = 1 con probabilidad 1, entonces hemos aumentado el valor esperado en 1.E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1)XX=1

jld
fuente
1
¿Entonces habrá niños en esta clase después de la adición del niño italiano? n+1
Scortchi - Restablece a Monica
Sí. ¿Hay algo que me falta relacionado con eso?
jld
1
Depende de cómo leas la pregunta. Supongamos que las clases son de exactamente 30 niños.
Scortchi - Restablece a Monica
1
Quizás entendí mal la pregunta. Pensé que estaba preguntando cómo la adición de un niño italiano conocido cambia las expectativas.
jld
1
Ese es un muy buen punto sobre el tamaño de las clases que posiblemente estén limitadas
jld
1

Binom(30,2/30)E(X|X1)XBinom(30,2/30)2.28


mi[XEl |X1]=yo=0 030yoPAGS(X=yoEl |X1)=0 030yoPAGS(X=yo,X1)PAGS(X1)=130yoPAGS(yo)1-PAGS(0 0)

(tenga en cuenta el cambio en el límite inferior de suma en el último paso)

jf328
fuente
1
¿Puedes dar más detalles sobre la expectativa condicional?
Antoni Parellada
3
Tu respuesta es incorrecta. La forma correcta de calcular esto sería como 1 (el niño conocido) + E (B (29, 2/30)) que resulta ser 2.9333. Y el supuesto de distribución binomial es cuestionable.
Erik
Una cosa más que me gustaría señalar: a) su cálculo de la expectativa condicional es incorrecto. Pero b) más importante, comenzar con su expectativa condicional es incorrecto. Saber que un niño específico es italiano rompe la intercambiabilidad asumida por la distribución binormal. Es muy similar a la paradoja niño-niña ( en.wikipedia.org/wiki/Boy_or_Girl_paradox ) donde hace la diferencia si sabes que el niño mayor es una niña o sabes que uno de los dos niños es una niña.
Erik
Rasca el comentario a) desde arriba. Pero b) es más serio de todos modos;)
Erik
Estoy de acuerdo. Para OP, la distribución ya no es binomial (30, 2/30), sino de hecho 1 + binomial (29, 2/30)
jf328
-3

No. Su conocimiento de los eventos inminentes no cambia nada sobre la experiencia típica de la escuela.

Mercado
fuente
2
-1. Esto es incorrecto, como se explica en detalle en otras respuestas y comentarios aquí.
ameba dice Reinstate Monica
perdona mi falta de matemáticas avanzadas, pero ¿qué hace que el hijo de este caballero NO sea uno de los 'típicamente 2' niños? ... de tal manera que terminemos más cerca de 3.
Martes
Mart: Imagina que lanzo una moneda diez veces y cuento las cabezas; nada extraño sobre la moneda o la forma en que la lanzo. Repito ese experimento muchas veces, y en promedio veo casi exactamente 5 cabezas en diez lanzamientos; los resultados que ve (1000 lanzamientos en total, de los cuales el 50.3% fueron cara, muy dentro de la variación esperada para un procedimiento de lanzamiento de monedas justo; decidimos aceptar que el proceso parece al menos prácticamente justo). Ahora hago el experimento una vez más contigo, y ves que los primeros 4 lanzamientos son todos cara. ¿Cuál es el número esperado de caras en el conjunto completo de diez lanzamientos? 5? ¿Más?
Glen_b -Reinstate Monica
Tenga en cuenta que según su argumento anterior, los primeros cuatro "podrían haber sido cuatro de los cinco esperados". Pero entonces estarías diciendo que hay menos de un 50% de probabilidad en los próximos seis lanzamientos (de hecho, estás diciendo que solo hay un 1/6 de probabilidad en promedio). ¿Cómo sabría la moneda que sale cara con menos frecuencia?
Glen_b -Reinstale Monica