Antecedentes: Nota: Mi conjunto de datos y mi código r se incluyen debajo del texto
Deseo usar AIC para comparar dos modelos de efectos mixtos generados usando el paquete lme4 en R. Cada modelo tiene un efecto fijo y un efecto aleatorio. El efecto fijo difiere entre modelos, pero el efecto aleatorio sigue siendo el mismo entre modelos. Descubrí que si uso REML = T, model2 tiene la puntuación AIC más baja, pero si uso REML = F, model1 tiene la puntuación AIC más baja.
Soporte para usar ML:
Zuur y col. (2009; PÁGINA 122) sugieren que "Para comparar modelos con efectos fijos anidados (pero con la misma estructura aleatoria), se debe usar la estimación ML y no REML". Esto me indica que debería usar ML ya que mis efectos aleatorios son los mismos en ambos modelos, pero mis efectos fijos difieren. [Zuur y col. 2009. Modelos y extensiones de efectos mixtos en ecología con R. Springer.]
Soporte para usar REML:
Sin embargo, noto que cuando uso ML, la varianza residual asociada con los efectos aleatorios difiere entre los dos modelos (modelo1 = 136.3; modelo2 = 112.9), pero cuando uso REML, es lo mismo entre modelos (modelo1 = modelo2 = 151,5). Esto implica para mí que debería usar REML para que la varianza residual aleatoria permanezca igual entre los modelos con la misma variable aleatoria.
Pregunta:
¿No tiene más sentido usar REML que ML para comparar modelos donde los efectos fijos cambian y los efectos aleatorios siguen siendo los mismos? Si no, ¿puede explicar por qué o señalarme otra literatura que explique más?
# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)
# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)
Conjunto de datos:
Response Fixed1 Fixed2 Random1
5.20 A A 1
32.50 A A 1
6.57 A A 2
24.77 A B 3
41.69 A B 3
34.29 A B 4
1.80 A B 4
10.00 A B 5
15.56 A B 5
4.44 A C 6
21.65 A C 6
9.20 A C 7
4.11 A C 7
12.52 B D 8
0.25 B D 8
27.34 B D 9
11.54 B E 10
0.86 B E 10
0.68 B E 11
4.00 B E 11
Respuestas:
Zuur et al. Y Faraway (del comentario de @ janhove arriba) tienen razón; El uso de métodos basados en la probabilidad (incluido AIC) para comparar dos modelos con diferentes efectos fijos que son ajustados por REML generalmente dará lugar a tonterías.
fuente
Este es un ejemplo de por qué REML no debe usarse al comparar modelos con diferentes efectos fijos. Sin embargo, REML a menudo estima mejor los parámetros de efectos aleatorios y, por lo tanto, a veces se recomienda usar ML para las comparaciones y REML para estimar un modelo único (quizás final).
fuente