Solo quiero revisar algunos razonamientos.
Si mi muestra original es de tamaño arranco, mi proceso de pensamiento es el siguiente:
es la posibilidad de cualquier observación extraída de la muestra original. Para garantizar que el próximo sorteo no sea la observación muestreada anteriormente, restringimos el tamaño de la muestra a . Por lo tanto, obtenemos este patrón:
¿Es esto correcto? Me tropiezo con por qué no puede ser lugar.
sampling
bootstrap
sample-size
subsampling
Jayant.M
fuente
fuente
Respuestas:
Tenga en cuenta que en cada posición de observación ( ) podemos elegir cualquiera de las n observaciones, por lo que hay n n posibles vuelve a muestrear (manteniendo el orden en el que se dibujan) de los cuales n ! son la "misma muestra" (es decir, contienen todas las n observaciones originales sin repeticiones; esto explica todas las formas de ordenar la muestra con la que comenzamos).i = 1 , 2 , . . . , n norte nortenorte n ! norte
Por ejemplo, con tres observaciones, a, byc, tiene 27 muestras posibles:
Seis de ellos contienen uno de cada uno de a, by c.
Entonces es la probabilidad de recuperar la muestra original.n ! / nnorte
Aparte: una aproximación rápida de la probabilidad:
Considera eso :
entonces
Siendo el límite inferior el habitual dado para la aproximación de Stirling (que tiene un error relativo bajo para grande ).norte
[Gosper ha sugerido usar que daría la aproximación √n ! ≈ ( 2 n + 13)π---------√nortenortemi- n para esta probabilidad, que funciona razonablemente bien hasta n = 3 , o incluso hasta n = 1 dependiendo de cuán estrictos sean sus criterios.]( 2 n + 13) π--------√mi- n n = 3 n = 1
Para más detalles, consulte
¿Por qué, en promedio, cada muestra de bootstrap contiene aproximadamente dos tercios de las observaciones?
fuente