Me preguntaba si alguien tenía experiencia en el uso de la función de ratones, como se describe en ratones: ¿Imputación multivariada por ecuaciones encadenadas en R (JSS 2011 45 (3))? Tengo un conjunto de datos con varias variables, cada una con diferentes grados de datos faltantes.
Mi pregunta principal es: digamos que uso la regresión lineal bayesiana para imputar datos faltantes, ¿ mice
usa automáticamente las variables predictoras de más significativas a menos significativas para imputar? Además, ¿es común promediar todos los conjuntos de datos imputados?
r
regression
bayesian
data-imputation
mice
mjburns
fuente
fuente
Respuestas:
Por defecto, los ratones usarán todas las variables en su conjunto de datos para predecir cualquier otra.
En cuanto al promedio, debe hacer esto después de calcular sus estadísticas, no antes. Por ejemplo, si desea hacer una regresión lineal, haría algo como esto:
La función de resumen le mostrará los coeficientes promediados.
fuente