He utilizado la imputación múltiple para obtener una serie de conjuntos de datos completos.
He utilizado métodos bayesianos en cada uno de los conjuntos de datos completos para obtener distribuciones posteriores para un parámetro (un efecto aleatorio).
¿Cómo puedo combinar / agrupar los resultados para este parámetro?
Más contexto:
Mi modelo es jerárquico en el sentido de alumnos individuales (una observación por alumno) agrupados en las escuelas. He realizado múltiples imputaciones (usando MICE
en R) en mis datos donde incluí school
como uno de los predictores para los datos faltantes, para tratar de incorporar la jerarquía de datos en las imputaciones.
He ajustado un modelo de pendiente aleatorio simple a cada uno de los conjuntos de datos completos (usando MCMCglmm
en R). El resultado es binario.
Descubrí que las densidades posteriores de la variación aleatoria de la pendiente se "comportan bien" en el sentido de que se parecen a esto:
¿Cómo puedo combinar / agrupar las medias posteriores y los intervalos creíbles de cada conjunto de datos imputado, para este efecto aleatorio?
Actualización1 :
Por lo que entiendo hasta ahora, podría aplicar las reglas de Rubin a la media posterior, para dar una media posterior imputada de manera múltiple: ¿hay algún problema al hacer esto? Pero no tengo idea de cómo puedo combinar los intervalos de 95% creíbles. Además, dado que tengo una muestra de densidad posterior real para cada imputación, ¿podría combinarlas de alguna manera?
Actualización2 :
Según la sugerencia de @ cyan en los comentarios, me gusta mucho la idea de simplemente combinar las muestras de las distribuciones posteriores obtenidas de cada conjunto de datos completo de la imputación múltiple. Sin embargo, me gustaría saber la justificación teórica para hacer esto.
fuente
Respuestas:
Con los posteriores particularmente bien comportados que pueden describirse adecuadamente mediante una descripción paramétrica de una distribución, es posible que pueda simplemente tomar la media y la varianza que mejor describe su posterior e ir desde allí. Sospecho que esto puede ser adecuado en muchas circunstancias en las que no se obtienen distribuciones posteriores realmente extrañas.
fuente
Si usa stata, hay un procedimiento llamado "mim" que agrupa los datos después de la imputación usando modelos de efectos mixtos. No sé si está disponible en R.
fuente