Número esperado de cartas invisibles al robar

10

Tenemos un mazo de cartas. Extraemos cartas de manera uniforme al azar con reemplazo. Después de 2 n sorteos, ¿cuál es el número esperado de cartas nunca elegidas?n2n

Esta pregunta es la parte 2 del problema 2.12 en

M. Mitzenmacher y E. Upfal, Probability and Computing: Randomized Algorithms and Probabilistic Analysis , Cambridge University Press, 2005.

Además, por lo que vale, este no es un problema de tarea. Es autoestudio y estoy atascado.

Mi respuesta hasta ahora es:

Sea el número de cartas distintas que se ven después del sorteo i . Entonces:Xii

E[Xi]=k=1nk(knP(Xi1=k)+nk1nP(Xi1=k1))

La idea aquí es que cada vez que robemos, robemos una carta que hayamos visto o robemos una carta que no hayamos visto, y que podamos definir esto de forma recursiva.

2nnE[X2n]

Creo que esto es correcto, pero que debe haber una solución más simple.

Cualquier ayuda sería muy apreciada.

Craig Wright
fuente
¿Lo ha simulado y comparado los resultados?
Adam

Respuestas:

10

n1n2n


fuente
3
(+1) Esto da un buen primer comienzo. La combinación de esto con la linealidad de la expectativa conduce a una solución económica y elegante.
cardenal
6

Gracias Mike por la pista.

Esto es lo que se me ocurrió.

XiXi=1ithpi=P(Xi=1)=(n1n)2npiip=pi

X=i=1nXi2n

E[X]=E[i=1nXi]=i=1nE[Xi]=i=1np=np

Y eso es lo que creo.

Craig Wright
fuente
44
npe2
Puede ser un poco más complicado que eso. La probabilidad de que se pierda la tarjeta (i) es la que usted escribió. Sin embargo, una vez que sabemos que se perdió la tarjeta (i), la probabilidad de que falte la tarjeta (j) cambia. No sé si el tema de la independencia cambiará el resultado final, pero complica la derivación.
Emil Friedman
@Emil Friedman: La expectativa es lineal si los sumandos son independientes o no. La falta de independencia afecta cantidades como la varianza, pero no la expectativa.
Douglas Zare
4

Aquí hay un código R para validar la teoría.

evCards <- function(n) 
{
    iter <- 10000;
    cards <- 1:n;
    result <- 0;
    for (i in 1:iter) {
        draws <- sample(cards,2*n,T);
        uniqueDraws <- unique(draws,F);
        noUnique <- length(uniqueDraws);
        noNotSeen <- n - noUnique;
        result <- result + noNotSeen;
    }
    simulAvg <- result/iter;
    theoryAvg <- n * ((n-1)/n)^(2*n);
    output <-list(simulAvg=simulAvg,theoryAvg=theoryAvg);
    return (output);
}
varty
fuente