Especificación de efectos aleatorios en el modelo de efectos mixtos lmer
8
¿Cuál es la diferencia entre (1|DNA.concentration/mouse.id)y (DNA.concentration|mouse.id)? ¿Qué significan los símbolos |y /significan dentro de la sintaxis para el efecto aleatorio?
¿Qué significa el símbolo "|" y "/" significa en factor aleatorio?
Yating Li
@gung La pregunta no se ajusta a las reglas del sitio. El OP debe contener algunos antecedentes sobre lo que están tratando de hacer. Sin embargo, creo que están pidiendo la diferencia en la sintaxis entre "/" y "|". Quizás el título de la publicación debería reflejar eso. ¿Sería una pregunta válida?
No creo que la pregunta vinculada sea un duplicado adecuado ... habla (1|a/b), pero no a la distinción entre (1|a/b)y (b|a)...
Ben Bolker
Respuestas:
14
Si tiene dos factores categóricosf y g, a continuación, se (1|f/g)expande a (1|f) + (1|f:g), es decir, la variación en la intercepción (que está 1en el lado izquierdo de la barra) entre niveles de fy entre niveles de f:g(la interacción entre fy g). Esto también se conoce como un efecto aleatorio de ganidado dentrof (el orden importa aquí). Esta es la forma tradicional de combinar dos factores aleatorios en un modelo ANOVA clásico, porque en ese marco los efectos aleatorios deben estar anidados (es decir, fanidados dentro go ganidados f). (Ver http://glmm.wikidot.com/faq para obtener más información sobre factores anidados). Este modelo estima dos parámetros, es decir σ2F y σ2F: g, sin importar cuántos niveles tenga cada variable categórica. Sería un modelo típico para un diseño anidado .
Por el contrario, (f|g)especifica que los efectos de fvaría en los niveles de g: por ejemplo, si fes una variable categórica de dos niveles con los niveles de "control" y "tratamiento", entonces este modelo especifica que estamos permitiendo que tanto el intercepto (respuesta de control) y El efecto del tratamiento (diferencia entre el control y las respuestas al tratamiento) varía según los niveles de g. Cada efecto tiene su propia variación, y por defecto lme4ajusta las covarianzas entre cada uno de los parámetros. Este modelo estimaría parámetrosσ2sol, c, σ2sol, ty σsol, c ⋅ t, donde el último se refiere a la covarianza entre el control y los efectos del tratamiento. SiF tiene norte niveles, este modelo estima n(n+1)/2parámetros; Es más apropiado para un diseño de bloques al azar donde cada tratamiento se repite en cada bloque.
Si ftiene muchos niveles, el último (f|g)) la especificación del modelo puede implicar modelos con muchos parámetros; Hay un debate en curso (ver, por ejemplo, este documento de ArXiv ) sobre la mejor manera de manejar esta situación.
Si en cambio consideramos (x|g)dónde xes una variable de entrada continua (numérica), entonces el término especifica un modelo de pendientes aleatorias; la intersección (implícitamente) y la pendiente con respecto a xambos varían a través de los niveles de g(también se ajusta un término de covarianza).
En este caso, no (g|x)tendría sentido: el término en el lado derecho de la barra es una variable de agrupación y siempre se interpreta como categórico. El único caso en el que podría tener sentido es en un diseño donde xera continuo, pero se tomaron múltiples observaciones en cada nivel, y donde quería tratarlo xcomo una variable categórica para fines de modelado.
(1|a/b)
, pero no a la distinción entre(1|a/b)
y(b|a)
...Respuestas:
Si tiene dos factores categóricosσ2F y σ2F: g , sin importar cuántos niveles tenga cada variable categórica. Sería un modelo típico para un diseño anidado .
f
yg
, a continuación, se(1|f/g)
expande a(1|f) + (1|f:g)
, es decir, la variación en la intercepción (que está1
en el lado izquierdo de la barra) entre niveles def
y entre niveles def:g
(la interacción entref
yg
). Esto también se conoce como un efecto aleatorio deg
anidado dentrof
(el orden importa aquí). Esta es la forma tradicional de combinar dos factores aleatorios en un modelo ANOVA clásico, porque en ese marco los efectos aleatorios deben estar anidados (es decir,f
anidados dentrog
og
anidadosf
). (Ver http://glmm.wikidot.com/faq para obtener más información sobre factores anidados). Este modelo estima dos parámetros, es decirPor el contrario,σ2sol, c , σ2sol, t y σsol, c ⋅ t , donde el último se refiere a la covarianza entre el control y los efectos del tratamiento. SiF tiene norte niveles, este modelo estima n(n+1)/2 parámetros; Es más apropiado para un diseño de bloques al azar donde cada tratamiento se repite en cada bloque.
(f|g)
especifica que los efectos def
varía en los niveles deg
: por ejemplo, sif
es una variable categórica de dos niveles con los niveles de "control" y "tratamiento", entonces este modelo especifica que estamos permitiendo que tanto el intercepto (respuesta de control) y El efecto del tratamiento (diferencia entre el control y las respuestas al tratamiento) varía según los niveles deg
. Cada efecto tiene su propia variación, y por defectolme4
ajusta las covarianzas entre cada uno de los parámetros. Este modelo estimaría parámetrosSi
f
tiene muchos niveles, el último(f|g)
) la especificación del modelo puede implicar modelos con muchos parámetros; Hay un debate en curso (ver, por ejemplo, este documento de ArXiv ) sobre la mejor manera de manejar esta situación.Si en cambio consideramos
(x|g)
dóndex
es una variable de entrada continua (numérica), entonces el término especifica un modelo de pendientes aleatorias; la intersección (implícitamente) y la pendiente con respecto ax
ambos varían a través de los niveles deg
(también se ajusta un término de covarianza).En este caso, no
(g|x)
tendría sentido: el término en el lado derecho de la barra es una variable de agrupación y siempre se interpreta como categórico. El único caso en el que podría tener sentido es en un diseño dondex
era continuo, pero se tomaron múltiples observaciones en cada nivel, y donde quería tratarlox
como una variable categórica para fines de modelado.fuente