¿Intervalos de confianza de bootstrap en parámetros o en distribución?

9

Disculpe lo que puede ser una pregunta obvia sobre bootstrapping. Fui absorbido temprano en el mundo bayesiano y nunca exploré el bootstrap tanto como debería haberlo hecho.

Me encontré con un análisis en el que los autores estaban interesados ​​en un análisis de supervivencia relacionado con algún tiempo de datos de falla. Tenían alrededor de 100 puntos y utilizaron la regresión para ajustar una distribución de Weibull a los datos. Como resultado de esto, obtuvieron estimaciones de los parámetros de escala y forma. Un enfoque muy tradicional. Sin embargo, luego usaron bootstrapping para muestrear del conjunto de datos original y, para cada nueva muestra, realizaron una regresión y obtuvieron una nueva distribución de Weibull. Los resultados del arranque se utilizaron para construir intervalos de confianza en la distribución de supervivencia.

Mi intuición es un poco conflictiva. Estoy familiarizado con los intervalos de confianza de arranque en los parámetros, pero no lo he visto utilizado para construir intervalos de confianza de distribución.

¿Alguien puede señalarme una referencia / fuente que pueda proporcionar alguna información? Gracias por adelantado.

Aengus
fuente
3
La pregunta en realidad es más general de lo que supones, porque realmente no importa cómo se estimaron los parámetros. El quid de la cuestión es que los parámetros determinan completamente las distribuciones. Por lo tanto, un conjunto de CI simultáneos en los parámetros es un CI para las distribuciones.
whuber
Entiendo eso y tal vez sea así de sencillo. Tal vez lo que me molesta es que el bootstrapping viene con su propio equipaje y me preguntaba si había algo sobre el procedimiento que introduce problemas adicionales cuando se usa para este próximo paso. Por otro lado, podría ser lo que desayuné lo que está royendo. Gracias por el comentario rápido.
Aengus
Debe ser el desayuno :-)
whuber
44
Hay al menos dos formas de arrancar. La forma más simple es simplemente extraer una muestra aleatoria de las observaciones dadas y estimar el modelo b veces ("pares" de arranque). También puede iniciar utilizando los residuos de un modelo (inicialización de "residuos"). El primero descuida la estructura de error en los datos, que el segundo método asume implícitamente que su modelo es correcto. Efron y Tibshirani (1993). "Una introducción a Bootstrap" es el lugar para comenzar.
Jason Morgan

Respuestas:

1

Básicamente, si tiene un intervalo de confianza conjunto para los parámetros que describen de forma única una distribución, entonces tiene un intervalo de confianza de distribución. Entonces su problema desaparece ... según el comentario de whuber.

Peter Ellis
fuente