He estado buscando modelos de efectos mixtos usando el paquete lme4 en R. Estoy usando principalmente el lmer
comando, así que haré mi pregunta a través del código que usa esa sintaxis. Supongo que una pregunta fácil en general podría ser: ¿está bien comparar dos modelos construidos lmer
utilizando razones de probabilidad basadas en conjuntos de datos idénticos? Creo que la respuesta a eso debe ser "no", pero podría ser incorrecta. He leído información contradictoria sobre si los efectos aleatorios tienen que ser iguales o no, y ¿qué componente de los efectos aleatorios se entiende por eso? Entonces, presentaré algunos ejemplos. Los tomaré de datos de medidas repetidas usando estímulos de palabras, tal vez algo como Baayen (2008) sería útil para interpretar.
Digamos que tengo un modelo donde hay dos predictores de efectos fijos, los llamaremos A y B, y algunos efectos aleatorios ... palabras y temas que los percibieron. Podría construir un modelo como el siguiente.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(tenga en cuenta que he dejado de lado intencionalmente data =
y asumiremos que siempre me refiero REML = FALSE
a la claridad)
Ahora, de los siguientes modelos, ¿cuáles están bien para comparar con una razón de probabilidad con respecto al anterior y cuáles no?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Reconozco que la interpretación de algunas de estas diferencias puede ser difícil o imposible. Pero dejemos eso a un lado por un segundo. Solo quiero saber si hay algo fundamental en los cambios aquí que impide la posibilidad de comparar. También quiero saber si, si los LR están bien, y las comparaciones de AIC también.
Respuestas:
Usando la máxima probabilidad, cualquiera de estos puede compararse con AIC; si los efectos fijos son los mismos (
m1
am4
), usar REML o ML está bien, generalmente se prefiere REML, pero si son diferentes, solo se puede usar ML. Sin embargo, la interpretación suele ser difícil cuando cambian tanto los efectos fijos como los aleatorios, por lo que, en la práctica, la mayoría recomienda cambiar solo uno u otro a la vez.El uso de la prueba de razón de verosimilitud es posible pero desordenado porque la aproximación chi-cuadrado habitual no se cumple cuando se prueba si un componente de varianza es cero. Ver la respuesta de Aniko para más detalles. (Felicitaciones a Aniko por leer la pregunta con más cuidado que yo y leer mi respuesta original con la suficiente atención como para notar que se perdió este punto. ¡Gracias!)
Pinhiero / Bates es la referencia clásica; describe el
nlme
paquete, pero la teoría es la misma. Bueno, casi lo mismo; Doug Bates ha cambiado sus recomendaciones sobre inferencia desde que escribió ese libro y las nuevas recomendaciones se reflejan en ellme4
paquete. Pero eso es más de lo que quiero entrar aquí. Una referencia más legible es Weiss (2005), Modelado de datos longitudinales.fuente
m
m
m4
m
m2
Sin embargo, como dijo @Aaron, muchos expertos no recomiendan hacer una prueba de razón de probabilidad como esta. Las posibles alternativas son los criterios de información (AIC, BIC, etc.) o el arranque del LRT.
[1] Self, SG y Liang, K. Propiedades asintóticas de estimadores de máxima verosimilitud y pruebas de razón de verosimilitud en condiciones no estándar J. Amer. Estadístico. Assoc., 1987, 82, 605-610.
fuente