Trabajando con la muestra bootstrap vs la muestra original

8

Considere una muestra de números reales. Digamos que queremos estimar la tendencia central de la población y tener una idea de nuestra incertidumbre en torno a esta estimación.

Pongamos a un lado las suposiciones sobre la distribución de la población por un momento, y consideremos los siguientes dos enfoques.

  1. Obtenga una muestra de bootstrap de la muestra de entrada. Es decir, muestrear con reemplazo (p. Ej., Obtener 100 muestras) y calcular la media de cada muestra. Luego sacamos la media y los intervalos de confianza en la distribución empírica resultante de las medias.
  2. Generamos la media de la muestra de entrada y los percentiles alrededor de la media para transmitir incertidumbre alrededor de la estimación.

Bootstrap vs muestra original:

  • Si bien entiendo qué enfoque # 1 hace. ¿Hay un estimador subyacente detrás del # 2?
  • ¿Qué transmitirían los percentiles alrededor de la media en el n. ° 2 en contraste con el IC del n. ° 1? El enfoque n. ° 2 transmite una sensación de incertidumbre, pero me resulta difícil relacionarlo con una interpretación bayesiana o frecuentista.
  • ¿Proporcionaría alguna vez el método # 2 un mejor estimador de la media de la población? (por ejemplo, menos sesgada y menor varianza)?
Amelio Vazquez-Reina
fuente

Respuestas:

5

El estimador en el n. ° 2 es lo que está generando el intervalo para ... la media muestral. Está utilizando el bootstrap para intentar obtener la distribución de muestreo de la media muestral, utilizando la distribución de muestreo para aproximarla.

Dado que es exactamente el mismo estimador en el n. ° 1 y n. ° 2, el n. ° 2 tendrá las mismas propiedades verdaderas (cualesquiera que sean, ya que en realidad no conoce la distribución verdadera, el verdadero nivel de dependencia, etc.) que en # 1, solo está tratando de obtener una de esas propiedades de dos maneras diferentes.

Glen_b -Reinstate a Monica
fuente