¿Existe un límite que sea el menos aceptable cuando se usa la imputación múltiple (MI)?
Por ejemplo, ¿puedo usar MI si los valores faltantes en una variable son el 20% de los casos mientras que otras variables tienen valores perdidos pero no a un nivel tan alto?
Respuestas:
De los comentarios, está seguro de que está en una situación MAR o MCAR. Entonces la imputación múltiple es al menos razonable. Entonces, ¿cuánto falta es tratable? Piénsalo de esta manera:
Básicamente, la imputación múltiple hace que todas las estimaciones de parámetros de su modelo sean menos seguras en función de la precisión con la que se pueden predecir los datos faltantes con su modelo de imputación, que dependerá, entre otras cosas, de la cantidad de faltas que necesita imputarse, y Número de imputaciones que utiliza.
Por lo tanto, cuánto falta 'demasiado' depende de la cantidad de varianza / incertidumbre adicional que esté dispuesto a soportar. Una cantidad útil para usted podría ser la eficiencia relativa ( ) de un análisis de MI. Esto depende de la 'fracción de información faltante' (no de la tasa simple de falta), generalmente llamada , y la cantidad de imputaciones, generalmente llamada , como .RE λ m RE≈1/(1+λ/m)
En lugar de generar las definiciones de información faltante, etc., simplemente lea las preguntas frecuentes de MI que aclaran las cosas. A partir de ahí, sabrá si desea abordar las fuentes originales: Rubin, etc.
Prácticamente hablando, probablemente debería probar un análisis de imputación y ver cómo funciona.
fuente
Puede encontrar
servicial.
fuente