Bootstrapping con un pequeño número de observaciones.

8

Digamos que he recopilado un pequeño número (N) de observaciones para una hipótesis que me gustaría probar. Podría usar el método bootstrap para producir una distribución de muestra para el resultado medio de N observaciones, pero me preocupa que este modelo se descomponga cuando N sea muy pequeño, introduciendo un error en la distribución de la muestra.

Entonces mi pregunta es, ¿cómo puedo determinar cuál es el N mínimo que necesito para obtener resultados razonables? o más cuantitativamente, ¿cómo se relaciona N con el error de muestreo como N-> 0?

Actualización: Estoy llegando a comprender que el valor mínimo para N variará según la naturaleza de los datos subyacentes. Entonces, en este caso, ¿qué metaobservaciones puedo hacer para ayudarme a determinar esto? No sé la verdadera distribución subyacente, de lo contrario no necesitaría arrancar.

SOL__
fuente
1
He visto un comentario interesante en las notas de clase del profesor Wasserman en stat.cmu.edu/~larry/=stat705/Lecture13.pdf . La notación al lado de la ecuación (21) en la p. 6 sugiere que el error que le preocupa cae como 1 / sqrt (n). Desafortunadamente, no sé nada sobre el coeficiente constante.
max

Respuestas:

7

No hay una respuesta directa a esto, ya que siempre dependerá de la distribución real de sus datos (imagine el caso degenerado en el que el único valor permitido es 1: entonces un arranque de una muestra de tamaño 1 será tan bueno como cualquier otra cosa) !) y la estadística que va a calcular: algunas estadísticas tendrán más problemas para recuperarse de un tamaño de muestra pequeño que otras (imagine un remuestreo de un valor atípico extremo).

Entonces: vas a tener que ser más específico de lo que nos has dado hasta ahora.

Nick Sabbe
fuente
1
¿Se pueden hacer inferencias sobre la distribución verdadera en función de las observaciones, quizás utilizando la varianza de las observaciones? El caso extremo atípico es difícil, pero si has visto uno, entonces lleva mucha información. Si revisamos la pregunta para especificar N> 2, entonces la segunda observación ya nos dice algo si N1 = N2 vs N1! = N2 (y cuál es la diferencia entre ellos).
G__
El bootstrapping de extremos no funciona, punto.
kjetil b halvorsen