Comparaciones permitidas de modelos de efectos mixtos (efectos aleatorios principalmente)

20

He estado buscando modelos de efectos mixtos usando el paquete lme4 en R. Estoy usando principalmente el lmercomando, así que haré mi pregunta a través del código que usa esa sintaxis. Supongo que una pregunta fácil en general podría ser: ¿está bien comparar dos modelos construidos lmerutilizando razones de probabilidad basadas en conjuntos de datos idénticos? Creo que la respuesta a eso debe ser "no", pero podría ser incorrecta. He leído información contradictoria sobre si los efectos aleatorios tienen que ser iguales o no, y ¿qué componente de los efectos aleatorios se entiende por eso? Entonces, presentaré algunos ejemplos. Los tomaré de datos de medidas repetidas usando estímulos de palabras, tal vez algo como Baayen (2008) sería útil para interpretar.

Digamos que tengo un modelo donde hay dos predictores de efectos fijos, los llamaremos A y B, y algunos efectos aleatorios ... palabras y temas que los percibieron. Podría construir un modelo como el siguiente.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(tenga en cuenta que he dejado de lado intencionalmente data =y asumiremos que siempre me refiero REML = FALSEa la claridad)

Ahora, de los siguientes modelos, ¿cuáles están bien para comparar con una razón de probabilidad con respecto al anterior y cuáles no?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Reconozco que la interpretación de algunas de estas diferencias puede ser difícil o imposible. Pero dejemos eso a un lado por un segundo. Solo quiero saber si hay algo fundamental en los cambios aquí que impide la posibilidad de comparar. También quiero saber si, si los LR están bien, y las comparaciones de AIC también.

John
fuente
1
Relacionado: stats.stackexchange.com/questions/117497 . Ver también bbolker.github.io/mixedmodels-misc/… .
ameba dice Reinstate Monica
(Noté que eliminó la etiqueta [prueba de hipótesis] que agregué anteriormente. Bueno, depende de usted, pero creo que es apropiado: la prueba de razón de probabilidad es claramente un procedimiento de prueba de hipótesis, y [modelo mixto] + [prueba de hipótesis ] es en mi humilde opinión una combinación de etiqueta informativa, ver stats.stackexchange.com/questions/tagged/… )
amoeba dice Reinstate Monica el
Editado para eliminar "prueba" de LR. Los LR se pueden interpretar sin prueba y lo hace más paralelo a los AIC y sigue mejor mi intención real. Gracias por señalar eso.
John

Respuestas:

13

Usando la máxima probabilidad, cualquiera de estos puede compararse con AIC; si los efectos fijos son los mismos (m1 a m4), usar REML o ML está bien, generalmente se prefiere REML, pero si son diferentes, solo se puede usar ML. Sin embargo, la interpretación suele ser difícil cuando cambian tanto los efectos fijos como los aleatorios, por lo que, en la práctica, la mayoría recomienda cambiar solo uno u otro a la vez.

El uso de la prueba de razón de verosimilitud es posible pero desordenado porque la aproximación chi-cuadrado habitual no se cumple cuando se prueba si un componente de varianza es cero. Ver la respuesta de Aniko para más detalles. (Felicitaciones a Aniko por leer la pregunta con más cuidado que yo y leer mi respuesta original con la suficiente atención como para notar que se perdió este punto. ¡Gracias!)

Pinhiero / Bates es la referencia clásica; describe el nlmepaquete, pero la teoría es la misma. Bueno, casi lo mismo; Doug Bates ha cambiado sus recomendaciones sobre inferencia desde que escribió ese libro y las nuevas recomendaciones se reflejan en el lme4paquete. Pero eso es más de lo que quiero entrar aquí. Una referencia más legible es Weiss (2005), Modelado de datos longitudinales.

Aaron - Restablece a Monica
fuente
Los modelos m2 y m4 o m1 y m3 no se pudieron comparar con la prueba de razón de probabilidad. No son modelos anidados.
Macro
¡Vaya, gracias por atrapar eso, @Macro! Ver editar.
Aaron - Restablece a Monica el
La cuestión era solo comparar los modelos con el modelo m, no entre sí. Pero, sin embargo, ¿estás diciendo que las comparaciones de AIC se pueden hacer incluso cuando no están anidadas? Las respuestas a esta pregunta parecen contradecir eso.
John
@John, leí esas respuestas pero me perdí donde se discute AIC y no anidado. Estoy bastante seguro de que está bien, pero ¿puedes darme un puntero más preciso a ese punto en las respuestas?
Aaron - Restablece a Monica el
Voté en contra de la respuesta, porque estás equivocado (o al menos engañoso) sobre la aplicabilidad de la prueba de razón de probabilidad.
Aniko
12

mmm4σ2=0

mm212χ12+12χ02χ12 .

Sin embargo, como dijo @Aaron, muchos expertos no recomiendan hacer una prueba de razón de probabilidad como esta. Las posibles alternativas son los criterios de información (AIC, BIC, etc.) o el arranque del LRT.

[1] Self, SG y Liang, K. Propiedades asintóticas de estimadores de máxima verosimilitud y pruebas de razón de verosimilitud en condiciones no estándar J. Amer. Estadístico. Assoc., 1987, 82, 605-610.

Aniko
fuente
1
Gracias por la información de LR. Realmente no había pensado en el problema del límite LR al hacer los modelos para el ejemplo. Acabo de notar que no está claro en su respuesta si sus recomendaciones se aplican a casos simples, como simplemente comparar modelos con diferentes efectos fijos (ML estimado, por supuesto).
John
No, este problema solo aparece cuando se prueban los componentes de varianza, no los efectos fijos.
Aaron - Restablece a Monica el