Explicación del factor de corrección finito.

25

Entiendo que cuando se toma una muestra de una población finita y nuestro tamaño de muestra es más del 5% de la población, necesitamos una corrección en la media y el error estándar de la muestra usando esta fórmula:

FPAGSdo=norte-nortenorte-1

Donde es el tamaño de la población es el tamaño de la muestra.nortenorte

Tengo 3 preguntas sobre esta fórmula:

  1. ¿Por qué el umbral se establece en 5%?
  2. ¿Cómo se derivó la fórmula?
  3. ¿Existen otros recursos en línea que expliquen exhaustivamente esta fórmula además de este documento?
Sara
fuente
8
¡No corriges la media!
whuber
2
Solo corrige la varianza.
SmallChess

Respuestas:

25

El umbral se elige de modo que asegure la convergencia de la distribución hipergeométrica ( es su SD), en lugar de una distribución binomial (para muestreo con reemplazo), a una distribución normal ( este es el Teorema del límite central, ver, por ejemplo, La curva normal, el Teorema del límite central y las Desigualdades de Markov y Chebychev para variables aleatorias ). En otras palabras, cuando (es decir, no es 'demasiado grande' en comparación con ), el FPC puede ignorarse con seguridad; es fácil ver cómo evoluciona el factor de corrección con variable para un fijo : con , tenemosnorte-nortenorte-1n N n N N = 10 , 000 FPC = .9995norte/ /norte0,05nortenortenortenortenorte=10,000FPC=.9995 cuando mientras cuando . Cuando , el FPC se acerca a 1 y estamos cerca de la situación de muestreo con reemplazo (es decir, como con una población infinita).FPC = .3162 n = 9 , 000 N norte=10FPC=.3162norte=9 9,000norte

Para comprender estos resultados, un buen punto de partida es leer algunos tutoriales en línea sobre la teoría de muestreo donde el muestreo se realiza sin reemplazo ( muestreo aleatorio simple ). Este tutorial en línea sobre estadísticas no paramétricas tiene una ilustración sobre cómo calcular la expectativa y la varianza para un total.

Notarás que algunos autores usan lugar de en el denominador del FPC; de hecho, depende de si trabaja con la estadística de muestra o población: para la varianza, será lugar de si está interesado en lugar de .N - 1 N N - 1 S 2 σ 2nortenorte-1nortenorte-1S2σ2

En cuanto a las referencias en línea, puedo sugerirle

chl
fuente
Esta fórmula se usa para población finita, pero con reemplazo o sin reemplazo.
skan
3
@skan sin reemplazo.
Black Milk