Supongamos que tenemos un conjunto A y un subconjunto B. Si sabemos | A |, entonces podemos calcular | B | al encontrar la probabilidad p de que un elemento elegido uniformemente al azar de A pertenece a B. Específicamente | A | p = | B |.
Supongamos que generamos n elementos de A de manera uniforme al azar y usamos estos datos para estimar p (número de elementos en B dividido por n) y, por lo tanto, estimar | B |.
¿Qué tan confiable es esta estimación? Es decir, ¿cómo podemos calcular el error?
Como pregunta adicional, ¿hay un nombre para esta técnica? (parece ser una versión matemática de la técnica de marcar y recapturar )
estimation
Douglas S. Stones
fuente
fuente
Respuestas:
Estás estimando proporciones. Para concretar, imagine que A es la población de votantes y B es el conjunto de votantes que votan por un candidato en particular. Por lo tanto, p sería el porcentaje de votantes que votarían por ese candidato. Dejar:
En otras palabras:
dónde
El error estándar para su estimación es:
fuente