Me preocupa el problema de que me gustaría arrancar el valor p para una estimación de partir de datos de imputación múltiple (MI), pero que no está claro para mí cómo combinar los valores p en los conjuntos de MI.
Para los conjuntos de datos MI, el enfoque estándar para llegar a la varianza total de las estimaciones utiliza las reglas de Rubin. Consulte aquí para una revisión de la agrupación de conjuntos de datos de MI. La raíz cuadrada de la varianza total sirve como una estimación de error estándar de . Sin embargo, para algunos estimadores, la varianza total no tiene una forma cerrada conocida o la distribución de muestreo no es normal. El estadístico θ / s e ( θ ) puede no estar distribuido en t, ni siquiera asintóticamente.
Por lo tanto, en el caso de los datos completos, una opción alternativa es iniciar el estadístico para encontrar la varianza, un valor p y un intervalo de confianza, incluso si la distribución de muestra no es normal y se desconoce su forma cerrada. En el caso de MI, hay dos opciones:
- Agrupe la varianza de arranque en los conjuntos de datos de MI
- Agrupe el valor p o los límites de confianza en los conjuntos de datos de MI
La primera opción volvería a utilizar las reglas de Rubin. Sin embargo, creo que esto es problemático si tiene una distribución de muestreo no normal. En esta situación (o más generalmente, en todas las situaciones), el valor p de arranque puede usarse directamente. Sin embargo, en el caso de MI, esto conduciría a múltiples valores de p o intervalos de confianza, que deben agruparse entre los conjuntos de datos de MI.
Entonces, mi pregunta es: ¿cómo debo agrupar múltiples valores p de arranque (o intervalos de confianza) en múltiples conjuntos de datos imputados?
Agradecería cualquier sugerencia sobre cómo proceder, gracias.
Respuestas:
Creo que ambas opciones dan como resultado la respuesta correcta. En general, preferiría el método 1, ya que conserva toda la distribución.
Para el método 2, use el procedimiento Licht-Rubin. Consulte ¿Cómo obtener valores p agrupados en pruebas realizadas en múltiples conjuntos de datos imputados?
fuente
Esta no es una literatura con la que estoy familiarizado, pero una forma de abordar esto podría ser ignorar el hecho de que estos son valores p de arranque y mirar la literatura sobre la combinación de valores p a través de conjuntos de datos imputados múltiples.
En ese caso, se aplican Li, Meng, Raghunathan y Rubin (1991) . El procedimiento se basa en estadísticas de cada uno de los conjuntos de datos imputados, ponderados utilizando una medida de la pérdida de información debido a la imputación. Se topan con problemas relacionados con la distribución conjunta de las estadísticas entre las imputaciones, y hacen algunas suposiciones simplificadoras.
De interés relacionado es Meng (1994) .
Actualizar
En la disertación de Christine Licht, Ch., Se describe un procedimiento para combinar valores p a través de conjuntos de datos imputados de manera múltiple . 4 . La idea, que atribuye a Don Rubin, es esencialmente transformar los valores p para que se distribuyan normalmente, que luego se pueden combinar a través de conjuntos de datos MI utilizando las reglas estándar para la combinación de estadísticas z.
fuente