Me gustaría recibir consejos sobre cómo agrupar los gráficos / estadísticas de calibración después de una imputación múltiple. En el contexto del desarrollo de modelos estadísticos para predecir un evento futuro (p. Ej., Utilizando datos de registros hospitalarios para predecir la supervivencia o eventos posteriores al alta hospitalaria), uno puede imaginar que falta mucha información. La imputación múltiple es una forma de manejar tal situación, pero resulta en la necesidad de agrupar las estadísticas de las pruebas de cada conjunto de datos de imputación teniendo en cuenta la variabilidad adicional debido a la incertidumbre inherente de la imputación.
Entiendo que hay múltiples estadísticas de calibración (hosmer-lemeshow, Harrell's Emax, índice de calibración estimado, etc.), para las cuales podrían aplicarse las reglas 'regulares' de Rubin para la agrupación.
Sin embargo, estas estadísticas a menudo son medidas generales de calibración que no muestran regiones específicas del modelo mal calibradas. Por esta razón, prefiero mirar un diagrama de calibración. Lamentablemente, no tengo idea de cómo 'agrupar' las parcelas o los datos detrás de ellas (probabilidades predichas por individuo y resultado observado por individuo), y no puedo encontrar mucho en la literatura biomédica (el campo con el que estoy familiarizado), o aquí, en CrossValidated. Por supuesto, mirar el gráfico de calibración de cada conjunto de datos de imputación podría ser una respuesta, pero podría volverse bastante molesto (presentar) cuando se crean muchos conjuntos de imputación.
Por lo tanto, me gustaría preguntar si existen técnicas que darían como resultado un diagrama de calibración, agrupado después de la imputación múltiple (?)
Respuestas:
En cuanto a referencias:
fuente