Digamos que he recopilado un pequeño número (N) de observaciones para una hipótesis que me gustaría probar. Podría usar el método bootstrap para producir una distribución de muestra para el resultado medio de N observaciones, pero me preocupa que este modelo se descomponga cuando N sea muy pequeño, introduciendo un error en la distribución de la muestra.
Entonces mi pregunta es, ¿cómo puedo determinar cuál es el N mínimo que necesito para obtener resultados razonables? o más cuantitativamente, ¿cómo se relaciona N con el error de muestreo como N-> 0?
Actualización: Estoy llegando a comprender que el valor mínimo para N variará según la naturaleza de los datos subyacentes. Entonces, en este caso, ¿qué metaobservaciones puedo hacer para ayudarme a determinar esto? No sé la verdadera distribución subyacente, de lo contrario no necesitaría arrancar.
Respuestas:
No hay una respuesta directa a esto, ya que siempre dependerá de la distribución real de sus datos (imagine el caso degenerado en el que el único valor permitido es 1: entonces un arranque de una muestra de tamaño 1 será tan bueno como cualquier otra cosa) !) y la estadística que va a calcular: algunas estadísticas tendrán más problemas para recuperarse de un tamaño de muestra pequeño que otras (imagine un remuestreo de un valor atípico extremo).
Entonces: vas a tener que ser más específico de lo que nos has dado hasta ahora.
fuente