Especificación de efectos aleatorios en el modelo de efectos mixtos lmer

8

¿Cuál es la diferencia entre (1|DNA.concentration/mouse.id)y (DNA.concentration|mouse.id)? ¿Qué significan los símbolos |y /significan dentro de la sintaxis para el efecto aleatorio?

Yating Li
fuente
¿Qué significa el símbolo "|" y "/" significa en factor aleatorio?
Yating Li
@gung La pregunta no se ajusta a las reglas del sitio. El OP debe contener algunos antecedentes sobre lo que están tratando de hacer. Sin embargo, creo que están pidiendo la diferencia en la sintaxis entre "/" y "|". Quizás el título de la publicación debería reflejar eso. ¿Sería una pregunta válida?
Antoni Parellada
1
Su respuesta puede estar aquí
Antoni Parellada
3
No creo que la pregunta vinculada sea un duplicado adecuado ... habla (1|a/b), pero no a la distinción entre (1|a/b)y (b|a)...
Ben Bolker

Respuestas:

14

Si tiene dos factores categóricosf y g, a continuación, se (1|f/g)expande a (1|f) + (1|f:g), es decir, la variación en la intercepción (que está 1en el lado izquierdo de la barra) entre niveles de fy entre niveles de f:g(la interacción entre fy g). Esto también se conoce como un efecto aleatorio de g anidado dentro f (el orden importa aquí). Esta es la forma tradicional de combinar dos factores aleatorios en un modelo ANOVA clásico, porque en ese marco los efectos aleatorios deben estar anidados (es decir, fanidados dentro go ganidados f). (Ver http://glmm.wikidot.com/faq para obtener más información sobre factores anidados). Este modelo estima dos parámetros, es decir σf2 y σf:g2, sin importar cuántos niveles tenga cada variable categórica. Sería un modelo típico para un diseño anidado .

Por el contrario, (f|g)especifica que los efectos de fvaría en los niveles de g: por ejemplo, si fes una variable categórica de dos niveles con los niveles de "control" y "tratamiento", entonces este modelo especifica que estamos permitiendo que tanto el intercepto (respuesta de control) y El efecto del tratamiento (diferencia entre el control y las respuestas al tratamiento) varía según los niveles de g. Cada efecto tiene su propia variación, y por defecto lme4ajusta las covarianzas entre cada uno de los parámetros. Este modelo estimaría parámetrosσg,c2, σg,t2y σg,ct, donde el último se refiere a la covarianza entre el control y los efectos del tratamiento. Sif tiene n niveles, este modelo estima n(n+1)/2parámetros; Es más apropiado para un diseño de bloques al azar donde cada tratamiento se repite en cada bloque.

Si ftiene muchos niveles, el último (f|g)) la especificación del modelo puede implicar modelos con muchos parámetros; Hay un debate en curso (ver, por ejemplo, este documento de ArXiv ) sobre la mejor manera de manejar esta situación.

Si en cambio consideramos (x|g)dónde xes una variable de entrada continua (numérica), entonces el término especifica un modelo de pendientes aleatorias; la intersección (implícitamente) y la pendiente con respecto a xambos varían a través de los niveles de g(también se ajusta un término de covarianza).

En este caso, no (g|x)tendría sentido: el término en el lado derecho de la barra es una variable de agrupación y siempre se interpreta como categórico. El único caso en el que podría tener sentido es en un diseño donde xera continuo, pero se tomaron múltiples observaciones en cada nivel, y donde quería tratarlo xcomo una variable categórica para fines de modelado.

Ben Bolker
fuente