¿Estoy especificando mi modelo de lmer correctamente?

9

He buscado en Google y este sitio y todavía estoy confundido acerca de la función lmer en la biblioteca lme4.

Tengo algunos datos recopilados de diferentes salas psiquiátricas, que tienen una estructura multinivel. Para simplificar, elegiré dos variables de nivel 2 y dos de nivel 1, aunque en realidad tengo algunas más.

Nivel 2- WardSize [esta es la cantidad de personas en la sala] Y FUE [esta es una medida de cuán "agradable" es la sala]

La variable de agrupación que le dice a R quién está en qué barrio se llama "Ward"

Nivel uno: Género [esto es género, obviamente] y BSITotal [esta es una medida de la gravedad de los síntomas]

El resultado es el autorrechazo, que de nuevo es lo que parece.

Tengo esta formula:

ayuda = lmer (fórmula = Autorrechazo ~ WardSize + WAS + Gender + BSITotal + (1 | Ward))

Espero que esto signifique que "cada individuo tiene un puntaje relacionado con su propio género y gravedad de los síntomas, y también un efecto de nivel de barrio relacionado con el tamaño del barrio y cuán" agradable "es".

¿Es esto correcto? Lo que me confunde es que no puedo ver cómo R puede decir cuáles son las variables de nivel 1 y las de nivel 2, excepto por la intercepción de nivel de sala dada al final.

Si alguien pudiera explicar la notación para que un idiota como yo pueda entender eso, sería aún mejor.

¡Muchas gracias!

Chris Beeley
fuente

Respuestas:

11

La especificación de su modelo está bien.

La intercepción variable para Ward, especificada en lmer como lo has hecho con (1 | Ward), dice que los sujetos dentro de cada barrio podrían ser más similares entre sí en Selfreject por razones que no sean WardSize o Gender, por lo que estás controlando heterogeneidad entre salas.

Puede pensar en el "1" como una columna de 1s (es decir, una constante) en los datos a los que se ajusta una intersección. Por lo general, el "1" está implícito automáticamente en lm, por ejemplo

lm(Y ~ X1 + X2)

en realidad especifica

lm(Y ~ 1 + X1 + X2)

Ahora que tiene su modelo básico, puede comenzar a hacer más preguntas como "¿La relación entre BSItotal y Selfreject difiere entre los barrios?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Es decir, tanto la intersección como la pendiente de BSITotal pueden diferir entre las salas.

Si aún no lo ha recogido, el Análisis de datos de Gelman & Hill usando regresión y modelo multinivel / modelos jerárquicos es un gran libro que explica modelos adecuados como este con lmer.

M Adams
fuente
1

Aquí hay un enlace a una explicación de Douglas Bates (quien escribió lme4) sobre por qué no es necesario especificar el nivel de los efectos fijos.

Breyer
fuente
2
Bienvenido al sitio, @Breyer. Sospecho que esta es una contribución útil. ¿Le importaría dar un breve resumen del argumento allí, para que los lectores puedan decidir si es lo que están buscando, o en el caso de un enlace futuro?
gung - Restablece a Monica
2
Gracias por la bienvenida @gung. Claro, Bates explica que no es necesario especificar niveles para efectos fijos porque el paquete lme4 está escrito para modelos mixtos, incluidos, entre otros, modelos multinivel / jerárquicos. Esto significa que los métodos computacionales no dependen de la especificación de niveles, como es el caso del software especializado de regresión multinivel (HLM, etc.) que aprovecha la estructura de datos anidados en el cálculo.
Breyer