¿Cómo dar cuenta de las medidas repetidas en glmer?

8

Mi diseño es el siguiente.

  • y es la respuesta de Bernoulli
  • X1 es una variable continua
  • X2 es una variable categórica (factor) con dos niveles

El experimento está completamente dentro de los sujetos. Es decir, cada sujeto recibe cada combinación deX1 y X2.

Esta es una configuración de regresión logística de medidas repetidas. El experimento dará dos ojivas parapags(y=1) vs X1, uno para el nivel 1 y otro para el nivel 2 de X2. El efecto deX2 debería ser que para el nivel 2 en comparación con el nivel 1, la ojiva debe tener una pendiente más baja y una mayor intercepción.

Estoy luchando por encontrar el modelo usando lme4. Por ejemplo,

glmer(y ~ x1*x2 + (1|subject), family=binomial)

Hasta donde yo entiendo, la 1|subjectparte dice que subjectes un efecto aleatorio. Pero no veo cómo especificar esoX1 y X2son medidas repetidas variables. Al final, quiero un modelo que incluya un efecto aleatorio para los sujetos y que proporcione pendientes e interceptaciones estimadas para el nivel 1 y el nivel 2.

Bill Simpson
fuente
Hay un ejemplo de medida repetida en estas diapositivas por D.Bates.
martin
1
¿Qué página de las 165 páginas? Por cierto, también tiene capítulos de libros disponibles.
Bill Simpson
1
|subjectespecifica la estructura de datos (medidas repetidas anidadas en subject), por lo que no es necesario especificarX1 y X2. 1|subjectdenota intercepción aleatoria para cada sujeto (nivel 2). Aquí solo puede obtener intercepciones y pendientes (a través de, x1|subjectpor ejemplo) para el nivel 2.
Randel

Respuestas:

11

tl; dr: su modelo ya explica el hecho de que tiene medidas repetidas. No obstante, si cabe, lo mejor sería usar:

glmer(y ~ x1*x2 + (x1:x2|subject), family=binomial)

pero si eso no es manejable, puedes intentar:

glmer(y ~ x1*x2 + (1|subject) + (0+x1|subject) + (0+x2|subject), family=binomial)

   Para una explicación de la sintaxis aquí, ver: R's lmer cheat-sheet .


Versión completa: no necesita "decirle" a R queX1 y X2son medidas repetidas variables. (Esto es realmente una pequeña distinción semántica, pero) No diría que las variables pueden ser "variables de medidas repetidas" frente a "variables de medidas no repetidas". Las variables son solo variables. Yo diría que, por ejemplo, 'la variable 1 se mide dentro de los pacientes, y la variable 2 se mide entre pacientes' o algo así. Por supuesto, su fraseo está bien, simplemente no desea que genere cierta confusión cuando piensa en las medidas repetidas como un estado ontológico intrínseco a la variable.

En cualquier caso, en lugar de decirle a R que una variable se mide dentro de las personas, simplemente necesita formular un modelo utilizando efectos aleatorios y / o fijos para tener en cuenta la no independencia de los datos que provienen de la misma persona. (Sí, puede usar un efecto fijo para dar cuenta de esto: cada persona sería un nivel de una variable categórica que se incluye. Sin embargo, esto responderá una pregunta ligeramente diferente, casi seguramente no la que le interesa, y a menos que usted tiene muchas mediciones en la misma persona en cada combinación de condiciones, el modelo no será manejable). En la práctica, utilizará efectos aleatorios para dar cuenta de esto. Específicamente, tendrá un efecto aleatorio para cada sujeto.

A continuación, tiene que especificar lo que quiere de efectos aleatorios para . La sintaxis que usó (1|subject)hará que R incluya una intercepción aleatoria para cada persona. Esto cambiará la línea de mejor ajuste de una persona en relación con la media. Debe pensar si es probable que las personas también difieran en sus pendientes, es decir, qué tan fuertemente responden a los cambios en sus variables. También debe pensar si los efectos aleatorios están correlacionados entre sí, por ejemplo, tal vez las personas que comienzan más alto cuandoX1=0 0 tienden a responder también con mayor fuerza a los aumentos en X1. Un consejo común es incluir todos los posibles efectos aleatorios e intercorrelaciones (Barr et al., 2013, "Keep it maximal", pdf ). Sin embargo, tenga en cuenta que los GLMM son más difíciles computacionalmente que los LMM, por lo que dicho modelo puede no ser manejable.

gung - Restablece a Monica
fuente