Matriz de varianza-covarianza en lmer

18

Sé que una de las ventajas de los modelos mixtos es que permiten especificar la matriz de varianza-covarianza para los datos (simetría compuesta, autorregresiva, no estructurada, etc.) Sin embargo, la lmerfunción en R no permite una fácil especificación de esta matriz. ¿Alguien sabe qué estructura lmerusa por defecto y por qué no hay forma de especificarlo fácilmente?

Nikita Kuznetsov
fuente

Respuestas:

9

Los modelos mixtos son (versiones generalizadas de) modelos de componentes de varianza. Anota la parte de efectos fijos, agrega términos de error que pueden ser comunes para algunos grupos de observaciones, agrega la función de enlace si es necesario y coloca esto en un maximizador de probabilidad.

Sin embargo, las diversas estructuras de varianza que está describiendo son los modelos de correlación de trabajo para las ecuaciones de estimación generalizadas, que compensan parte de la flexibilidad de los modelos mixtos / multinivel por la robustez de la inferencia. Con GEE, solo está interesado en realizar inferencias en la parte fija, y está de acuerdo con no estimar los componentes de la varianza, como lo haría en un modelo mixto. Para estos efectos fijos, obtienes una estimación robusta / sándwich que es apropiada incluso cuando tu estructura de correlación es mal específica. Sin embargo, la inferencia para el modelo mixto se desglosará si el modelo está mal especificado.

Entonces, si bien tienen mucho en común (una estructura multinivel y la capacidad de abordar las correlaciones residuales), los modelos mixtos y los GEE siguen siendo procedimientos algo distintos. El paquete R que trata con GEE se llama apropiadamente gee, y en la lista de posibles valores de corstropción encontrará las estructuras que mencionó.

Desde el punto de vista de GEE, lmerfunciona con correlaciones intercambiables ... al menos cuando el modelo tiene dos niveles de jerarquía, y solo se especifican intercepciones aleatorias.

StasK
fuente
Gracias Stas. No he oído hablar de GEE antes y solo estoy tratando de aprender el modelado mixto (que es complicado y también se amplifica por las diferencias en la implementación del software). Voy a intentar GEE. Realmente tengo un experimento simple con medidas repetidas con medidas dependientes biomédicas. Estoy interesado en la parte fija principalmente. Mi entrenamiento anterior es principalmente en ANOVA de efectos fijos estándar, por lo que puede ser una transición más fácil.
Nikita Kuznetsov
Me gusta la idea de estimar los parámetros fijos y he probado la biblioteca gee. También hay otras bibliotecas (geepack, por ejemplo). ¿Son peores por alguna razón? En mi campo, la gente necesita informar los valores p. ¿Hay alguna forma de obtenerlos de las estimaciones y también realizar comparaciones por pares teniendo en cuenta la agrupación?
Nikita Kuznetsov
¿Comparaciones por parejas de qué? La variedad de bibliotecas R siempre me ha vuelto loco, y no investigo las diferencias entre paquetes a menos que tenga una necesidad real de trabajar en un modelo específico.
StasK
StatsK, ¿es esto realmente correcto? Soy un principiante en el modelado multinivel, pero Hox (2010) o Rabe-Hesketh y Skrondal (2013) distinguen claramente entre los estimadores de varianza diferentes a través de MLE y GEE. Por ejemplo, al calcular el error estándar sándwich "robusto", Hox (pág. 260) dice que puede calcularlos mediante modelado multinivel utilizando la matriz de información / inversa de la matriz de Hesse (teniendo en cuenta la estructura multinivel) o mediante la estimación de la varianza a partir de residuos brutos y el uso de GLS después para calcular los coeficientes (enfoque GEE)
Arne Jonas Warnke
1
No estoy seguro de que la distinción sugerida por StasK sea realmente correcta aquí. Si bien las GEE utilizan estas estructuras de correlación alternativas, es perfectamente posible ajustar modelos mixtos (totalmente paramétricos) con estructuras más complicadas para la covarianza de efectos aleatorios o errores residuales, y el paquete nlme en R, SAS Proc Mixed o Los comandos mixtos de Stata hacen esto.
Jonathan Bartlett el
4

La rama FlexLamba de lmer proporciona dicha funcionalidad.

Consulte https://github.com/lme4/lme4/issues/224 para ver ejemplos de cómo implementar una estructura específica de errores o efectos aleatorios.

majom
fuente
¿Puedo tener las sucursales regulares y FlexLambda instaladas a la vez? ¿Cómo?
skan
3

Que yo sepa, lmer no tiene una manera "fácil" de abordar esto. También dado que en la mayoría de los casos, lmer hace un uso intensivo de matrices dispersas para la factorización de Cholesky, me parecería poco probable que permita VCV totalmente desestructurados.

(1El |RunnorteremiFF1)+(1El |RunnorteremiFF2)

R=[σRmi120 00 00 00 00 00 0σRmi120 00 00 00 00 00 0σRmi120 00 00 00 00 00 0σRmi220 00 00 00 00 00 0σRmi220 00 00 00 00 00 0σRmi22]

Sin embargo, no todo se pierde con LME: puede especificar estos atributos de matriz VCV "fácilmente" si está utilizando el paquete R MCMCglmm. Mira el CourseNotes.pdf , p.70. En esa página, da algunos análogos sobre cómo se definiría la estructura de efectos aleatorios lme4, pero como verá usted mismo, lmer es menos flexible que MCMCglmm en este asunto.

A mitad de camino hay un problema en las clases de estructura lme, por ejemplo. corCompSymm , corAR1 , etc. etc. La respuesta de Fabian en esta banda de rodadura proporciona algunos ejemplos más concisos para la especificación VCV basada en lme4, pero como se mencionó anteriormente, no son tan explícitamente como los de MCMCglmm o nlme.

usεr11852 dice Reinstate Monic
fuente
No "confío" en MCMCglmm, debido a la ingenua elección de distribuciones anteriores.
Stéphane Laurent
A. No creo que sea "ingenuo"; Pueden reflejar suposiciones válidas. Incluso puedes definir antecedentes inapropiados si sientes eso por algo. B. Esa fue solo una parte de mi respuesta, no decía que era el único camino a seguir; Di ejemplo para lme4. C. Si necesita hacer efectos mixtos multivariados, es prácticamente el único paquete disponible junto con sabreR ...
usεr11852 dice Reinstate Monic
Lo siento, mi comentario no fue una crítica sobre su respuesta. Al decir "antecedentes ingenuos", hablé sobre los antecedentes no informativos.
Stéphane Laurent
No parece probable que esta matriz R sea correcta. Incluso el ANOVA "clásico" de medidas repetidas permite correlaciones distintas de cero entre las condiciones (estoy pensando en la matriz de simetría compuesta). Me parece que esta matriz solo sería válida para un diseño entre sujetos con asignación aleatoria con dos grupos.
Nikita Kuznetsov
La matriz es "correcta"; dado que de hecho definí dos grupos como: (1El |RunnorteremiFF1)+(1El |RunnorteremiFF2)