Ejecuté un diseño repetido mediante el cual probé 30 hombres y 30 mujeres en tres tareas diferentes. Quiero entender cómo el comportamiento de hombres y mujeres es diferente y cómo eso depende de la tarea. Utilicé tanto el paquete lmer como el lme4 para investigar esto, sin embargo, estoy atascado tratando de verificar las suposiciones para cualquiera de los métodos. El código que ejecuto es
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
Verifiqué si la interacción era el mejor modelo comparándolo con el modelo más simple sin la interacción y ejecutando un anova:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
P1: ¿Está bien usar estos predictores categóricos en un modelo mixto lineal?
P2: ¿Entiendo correctamente que está bien que la variable de resultado ("comportamiento") no necesite ser distribuida normalmente (por sexo / tareas)?
P3: ¿Cómo puedo verificar la homogeneidad de la varianza? Para un modelo lineal simple que uso plot(LM$fitted.values,rstandard(LM))
. ¿Es plot(reside(lm.base1))
suficiente el uso ?
P4: Para verificar la normalidad, ¿está utilizando el siguiente código?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
fuente
Respuestas:
P1: Sí, como cualquier modelo de regresión.
P2: Al igual que los modelos lineales generales, su variable de resultado no necesita distribuirse normalmente como una variable univariada. Sin embargo, los modelos LME suponen que los residuos del modelo se distribuyen normalmente. Por lo tanto, una transformación o agregar pesos al modelo sería una forma de encargarse de esto (y verificar con diagramas de diagnóstico, por supuesto).
Q3:
plot(myModel.lme)
P4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Este código le permitirá realizar gráficos QQ para cada nivel de los efectos aleatorios. Los modelos LME suponen que no solo los residuos dentro del grupo están normalmente distribuidos, sino que cada nivel de los efectos aleatorios también. Varíelevel
de 0, 1 a 2 para que pueda verificar la rata, la tarea y los residuos dentro del sujeto.EDITAR: También debería agregar que si bien se supone la normalidad y que la transformación probablemente ayuda a reducir los problemas con errores no normales / efectos aleatorios, no está claro que todos los problemas se resuelvan realmente o que no se introduzca un sesgo. Si sus datos requieren una transformación, tenga cuidado con la estimación de los efectos aleatorios. Aquí hay un documento que aborda esto .
fuente
Parece bastante engañoso sobre los supuestos que rodean a los modelos de varios niveles. No existe una suposición de homogeneidad de varianza en los datos, solo que los residuos deben distribuirse aproximadamente normalmente. Y los predictores categóricos se usan en la regresión todo el tiempo (la función subyacente en R que ejecuta un ANOVA es el comando de regresión lineal).
Para obtener detalles sobre el examen de los supuestos, consulte el libro Pinheiro y Bates (p. 174, sección 4.3.1). Además, si planea usar lme4 (sobre el cual el libro no está escrito) puede replicar sus tramas usando plot con un
lmer
modelo (?plot.merMod
).Para comprobar rápidamente la normalidad, simplemente sería
qqnorm(resid(myModel))
.fuente
Con respecto a Q2:
De acuerdo con el libro de Pinheiro y Bates, puede usar el siguiente enfoque:
Si desea verificar las variaciones iguales entre
sex
usted, puede usar este enfoque:Si las variaciones son diferentes, puede actualizar su modelo de la siguiente manera:
Además, puede echar un vistazo al
robustlmm
paquete que también utiliza un enfoque de pesaje. La tesis doctoral de Koller sobre este concepto está disponible como acceso abierto ("Estimación robusta de modelos lineales mixtos"). El resumen dice:No tengo suficientes puntos para comentarios. Sin embargo, veo la necesidad de aclarar algunos aspectos de la respuesta de @John arriba. Pinheiro y Bates afirman en la pág. 174:
De hecho, esta afirmación no es clara acerca de las variaciones homogéneas y no soy lo suficientemente profundo en las estadísticas para conocer todas las matemáticas detrás del concepto LME. Sin embargo, en la p. 175, §4.3.1, la sección que trata de la Asunción 1 que escriben:
Además, en los siguientes ejemplos, las " variaciones constantes " son realmente importantes. Por lo tanto, se puede especular si implican variaciones homogéneas cuando escriben " distribuido de manera idéntica " en la p. 174 sin abordarlo más directamente.
fuente
Q1: Sí, ¿por qué no?
P2: Creo que el requisito es que los errores se distribuyan normalmente.
P3: se puede probar con la prueba de Leven, por ejemplo.
fuente