El embolsado es el proceso de crear N alumnos en N muestras de bootstrap diferentes, y luego tomar la media de sus predicciones.
Mi pregunta es: ¿por qué no usar ningún otro tipo de muestreo? ¿Por qué usar muestras de bootstrap?
Interesante pregunta. El bootstrap tiene buenas propiedades de muestreo, en comparación con algunas alternativas como la navaja. La desventaja principal de bootstrapping es que cada iteración tiene que trabajar con una muestra que es tan grande como el conjunto de datos original (que puede ser computacionalmente costoso), mientras que algunas otras técnicas de muestreo pueden funcionar con muestras mucho más pequeñas.
Este documento sugiere que cortar ingenuamente el tamaño de la muestra puede reducir el rendimiento, en relación con el embolsado basado en bootstrap, lo que sería una razón para no hacerlo. El documento también presenta un método novedoso para usar muestras más pequeñas en las estimaciones de embolsado, al tiempo que evita esos problemas.