¿Cómo construir un intervalo de confianza del 95% de la diferencia entre medianas?

27

Mi problema: el ensayo aleatorizado de grupos paralelos que tiene una distribución muy sesgada del resultado primario. No quiero asumir la normalidad y usar IC del 95% basados ​​en la normalidad (es decir, usando 1.96 X SE).

Me siento cómodo expresando la medida de tendencia central como la mediana, pero mi pregunta es cómo construir un IC del 95% de la diferencia en las medianas entre los dos grupos.

Lo primero que viene a la mente es el bootstrapping (volver a muestrear con reemplazo, determinar la mediana en cada uno de los dos grupos y restar uno del otro, repetir 1000 veces y usar el IC del 95% con corrección de sesgo). ¿Es este el enfoque correcto? ¿Cualquier otra sugerencia?

pmgjones
fuente
3
Eso fue lo primero que me vino a la mente también. ¿Qué tamaño de muestra tienes?
jbowman
40 personas en cada uno de los dos grupos = 80 en total.
pmgjones
3
Puede buscar en el intervalo de confianza no paramétrico y el estimador la diferencia de los parámetros de ubicación basados ​​en el estimador de Hodges-Lehmann . Como se explica en la página de ayuda para R wilcox.test()(debajo Details), esto está estrechamente relacionado con la diferencia en las medianas, pero no es lo mismo.
caracal
2
Con respecto a bootstrapping la mediana, podría valer la pena leer sobre el bootstrap suavizado.
caracal
@caracal: Este es un buen punto. Tanto el bootstrap normal como el suavizado tienen una cobertura asintótica correcta, pero la probabilidad de cobertura del bootstrap suavizado converge a una tasa ligeramente más rápida. Si no recuerdo mal, para el arranque de costumbre, y O ( n - 2 / 5 ) para la bootstrap alisada. Hay una breve discusión de esto con referencias adicionales en la Regresión Cuantil de Koenker (2005).|P(mI^n)0.95|=O(n1/3)O(n2/5)
Paul

Respuestas:

10

El procedimiento de arranque que describa debe ser válido. Sin embargo, es importante tener en cuenta que, al igual que el IC del 95% basado en la normalidad, un intervalo de confianza de arranque solo garantiza una cobertura correcta asintóticamente. Una cosa buena de trabajar con la mediana u otros cuantiles es que puedes construir intervalos de confianza de muestras finitas exactas bajo suposiciones muy débiles. La idea básica es que bajo nulo que la mediana de es m , el indicador para y < m es una variable aleatoria de Bernoulli 0.5. Puede utilizar esta observación para crear una estadística de prueba con una distribución de muestra finita conocida. Ver Chernozhukov, Hansen, Jansson (2009) para más detalles.ymy<m

Paul
fuente
1
¿Podría explicar lo que quiere decir que solo es válido asintóticamente? Estoy específicamente inseguro de lo que asintóticamente significa en este contexto. ¡Gracias!
pmgjones
I^nmP(mI^n)=0.95mI^nP(mI^n)=0.95limnP(mI^n)=0.95