Notación para modelado multinivel

10

La fórmula que uno debe especificar para entrenar un modelo multinivel (usando lmerdesde la lme4 Rbiblioteca) siempre me da. He leído innumerables libros de texto y tutoriales, pero nunca lo he entendido correctamente.

Así que aquí hay un ejemplo de este tutorial que me gustaría ver formulado en una ecuación. Estamos tratando de modelar la frecuencia de voz en función del género (las mujeres tienen una voz más aguda que los hombres en general) y la actitud de la persona (ya sea que haya respondido de manera educada o informal) en diferentes escenarios. Además, como puede ver en la subjectcolumna, cada persona fue sometida a mediciones varias veces.

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject, gendery attitudeson factores (con informaly femaleconsiderados como niveles base para attitudey genderen las ecuaciones a continuación). Ahora, una idea es entrenar un modelo con diferentes intersecciones para cada uno subjecty scenario:

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

Si mi comprensión de la notación es correcta, esto corresponde a:

pol i + γ macho iyi=aj[i]1+ak[i]2+β attitudepoli+γ gendermalei

donde denota i t h punto de datos, j [ i ] denota nivel de grupo para y k [ i ] denota nivel de grupo para i t h punto de datos. pol y male son indicadores binarios.iithj[i]subjectk[i]scenarioithattitudepolgendermale

Para introducir pendientes aleatorias para la actitud, podemos escribir:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

Nuevamente, si mi comprensión es clara, esto corresponde a:

yi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepoli+γ gendermalei

Ahora, ¿a qué ecuación Rcorresponde el siguiente comando?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)
abhinavkulkarni
fuente
1
no muy sensato; se supone que la pendiente promedio de la población con respecto a la actitud es cero ...
Ben Bolker
@BenBolker: Oye, ¿puedes escribirlo en forma de ecuación? ¿Son correctas mis ecuaciones anteriores? En el último modelo, todavía veo attitudeestar condicionado subjecty scenario.
abhinavkulkarni

Respuestas:

12

Yo escribiría

~ attitude + gender + (1|subject) + (1|scenario)

como

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b2,k[i]+ϵib1N(0,σ12)b2N(0,σ22)ϵN(0,σr2)
βbI
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

agrega variación entre sujetos en respuesta a attitudey scenario(podríamos escribir de manera equivalente la parte de efectos aleatorios como (attitude|subject) + (attitude|scenario), es decir, dejar la intersección implícita; esto es cuestión de gustos). Ahora

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b3,j[i]I(attitude=pol)+b2,k[i]+b4,k[i]I(attitude=pol)+ϵi{b1,b3}MVN(0,Σ1){b2,b4}MVN(0,Σ2)ϵN(0,σr2)
Σ1Σ2
Σ1=(σ12σ13σ13σ32)
Σ2

yi(β0+b1,j[i]+b2,k[i])+(β1+b3,j[i]+b4,k[i])I(attitude=pol)+β2I(gender=male)+ϵi

attitudeβ1=0attitude

Ben Bolker
fuente