Actualmente estoy ejecutando un modelo de regresión múltiple utilizando datos imputados y tengo algunas preguntas.
Antecedentes:
Uso de SPSS 18. Mis datos parecen ser MAR. La eliminación en lista de casos me deja con solo 92 casos, la imputación múltiple deja 153 casos para el análisis. Todos los supuestos cumplidos: un registro variable transformado. 9 IV's 5 - 5 categóricos, 3 escalas, 1 intervalo. Escala DV. Usando el método enter de regresión múltiple estándar.
- Mi DV es la diferencia de puntajes entre una medida de puntaje anterior y posterior, a estas dos variables les faltan varios casos: ¿debo imputar los valores faltantes para cada uno de ellos y luego calcular la diferencia entre ellos para calcular mi DV? (¿cómo hago para hacer esto?) o ¿puedo simplemente imputar datos para mi DV? ¿Cuál es el enfoque más apropiado?
- ¿Debo ejecutar imputaciones en datos transformados o datos no transformados sesgados?
- ¿Debo ingresar todas las variables en el proceso de imputación, incluso si no faltan datos, o debería simplemente imputar datos para las variables que faltan más del 10% de los casos?
He ejecutado la regresión en los casos eliminados en listas y mi IV representa muy poca variación en mi DV, luego he ejecutado la regresión en un archivo completo después de una imputación múltiple. Los resultados son muy similares, ya que mis 9 IV todavía predecir solo aproximadamente el 12% de la varianza en mi DV, sin embargo, ahora uno de mis IV's indica que está haciendo una contribución significativa (esta es una variable transformada logarítmica) ...
- ¿Debo informar los datos originales si hay poca diferencia entre mis conclusiones, es decir, mi IV pronostica mal el dv o informa los datos completos?
R^2
ocurra un nivel bajo ). Vea una buena discusión sobre los diseños previos a la publicación aquí . ¡Aunque eso todavía no responde totalmente a tu pregunta!Respuestas:
Referencias
Edwards, JR (1994). Análisis de regresión como alternativa a los puntajes de diferencia. Journal of Management , 20 , 683-689.
Enders, CK (2010). Análisis de datos faltantes aplicados . Nueva York, NY: Guilford Press.
fuente
En mi experiencia, la función de imputación de SPSS es fácil de usar, tanto para crear conjuntos de datos como para analizar y agrupar los conjuntos de datos de imputación resultantes. Sin embargo, su facilidad de uso es su caída también. Si observa una función de imputación similar en el
R
software estadístico (consulte, por ejemplo, elmice
paquete), verá muchas más opciones. Consulte el sitio web de Stef van Buurens para obtener una excelente explicación de la imputación múltiple en general (con o sin el paquete de ratones).Es muy importante tener en cuenta que estas opciones adicionales no son elecciones de 'lujo' solo para usuarios avanzados . Algunos son esenciales para lograr la simpatía adecuada , modelos específicos para variables faltantes específicas , predictores específicos para variables faltantes específicas , diagnóstico de imputación y más, que no están disponibles en la función de imputación SPSS.
En cuanto a sus preguntas:
fuente