Número esperado de duplicados (triplicados, etc.) al dibujar con reemplazo

10

Tengo el siguiente problema:

Tengo 100 elementos únicos (n), y estoy seleccionando 43 (m) de ellos uno a la vez (con reemplazo).

Necesito resolver el número esperado de exclusivos (solo seleccionados una vez, k = 1), dobles (seleccionados exactamente dos veces k = 2), triples (exactamente k = 3), quads, etc.

He podido encontrar muchos resultados sobre la probabilidad de que haya al menos un doble (paradoja del cumpleaños), pero no sobre el número esperado de pares en la población.

Kaitlyn K
fuente
¿Le sería útil una estimación de Monte Carlo o necesita la respuesta en forma cerrada?
David J. Harris
Preferiría una fórmula de forma cerrada para poder aplicarla fácilmente a diferentes valores de n, m y k.
Kaitlyn K

Respuestas:

7

ithBinom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Puede obtener el valor numérico en R con el comando n * dbinom (k, m, 1 / n).

Stefan Wager
fuente
¿Se puede usar esa fórmula para ak = 0 o 1?
Kaitlyn K
Sí puede. Con k = 0, puede interpretarlo como "cuántos puntos no aparecerán entre los m seleccionados".
Stefan Wager
Pero estos eventos no son independientes. Por ejemplo, cuando el elemento 1 aparece m veces, no puede aparecer ningún otro elemento. No puedes simplemente sumar las P's.
asterix314