Tengo un conjunto de datos que analiza las solicitudes de inmigración y las aceptaciones de visas (otorgamiento de visas). Las tarifas se calculan para las solicitudes de visa "aceptadas" y "rechazadas".
Sin embargo, el conjunto de datos también tiene valores para los casos que se cerraron. Normalmente esto es cuando el inmigrante dejó de presentarse a las citas, emigró a otro lugar o murió. Debido a que estos números no se usan cuando se calculan las tasas, las tasas a menudo aparecen como faltantes (porque los casos no fueron aceptados ni rechazados).
Dicho esto, si los únicos casos para ese año estuvieran "cerrados de otra manera", ¿alguna vez estaría bien abandonar estas observaciones? Parte del problema que tengo es que los años aleatorios en el conjunto de datos se eliminarán, porque las únicas decisiones para ese año fueron cerradas.
Los casos cerrados de otra manera son muy arbitrarios, y como mencioné, probablemente sean casos en los que el inmigrante emigró a otro lugar, y probablemente solo utilizó el primer país como un lugar de tránsito temporal. Los datos no dicen específicamente por qué los inmigrantes se fueron, por qué fueron cerrados, etc. No estoy realmente seguro de cómo lidiar con estos valores perdidos. No creo que los métodos de imputación estándar funcionen aquí, debido a los cálculos de la tasa (pero podría estar equivocado).
fuente
Respuestas:
En su caso, la distinción importante no es la distinción entre MCAR, MAR y NMAR, sino entre valores perdidos reales y valores faltantes mecánicos. Los valores perdidos reales son valores que existen, pero por alguna razón no se registraron. Los valores mecánicos faltantes no existen, pero la estructura rectangular de un conjunto de datos nos obliga a darle un valor, por ejemplo, el estado del embarazo si su conjunto de datos también incluye hombres. Las técnicas de imputación están diseñadas para valores perdidos reales. Su ejemplo es un caso de valores mecánicos faltantes; la decisión no se ha tomado, por lo que su valor no existe. Si una parte sustancial de los migrantes se muda, esa es una característica importante del proceso de migración, y la imputación de esos valores oculta esa característica.
fuente
Está claro una mezcla de al menos 2 procesos diferentes de falta.
Qué hacer con MNAR es difícil. Asumir que tales casos no tuvieron éxito puede ser un poco extremo (o muy apropiado, después de todo, no tuvieron éxito). O impute bajo MAR y observe cómo hacer que estos casos sean menos exitosos hasta que alcance el 0% y contemple ese rango de valores.
fuente