Estoy ejecutando un GEE en datos no balanceados de 3 niveles, usando un enlace logit. ¿Cómo difiere esto (en términos de las conclusiones que puedo extraer y el significado de los coeficientes) de un GLM con efectos mixtos (GLMM) y un enlace logit?
Más detalles: Las observaciones son ensayos individuales de Bernoulli. Se agrupan agrupados en aulas y escuelas. Usando R. Casewise omisión de NAs. 6 predictores también términos de interacción.
(No estoy volteando a los niños para ver si aterrizan cara a cara).
Me inclino a exponer los coeficientes a odds-ratios. ¿Tiene esto el mismo significado en ambos?
Hay algo al acecho en mi mente sobre "medios marginales" en los modelos GEE. Necesito que me expliquen esa parte.
Gracias.
Respuestas:
En cuanto a la interpretación de los coeficientes, hay una diferencia en el caso binario (entre otros). Lo que difiere entre GEE y GLMM es el objetivo de inferencia: promedio poblacional o específico del tema .
Consideremos un ejemplo inventado simple relacionado con el tuyo. Desea modelar la tasa de fracaso entre niños y niñas en una escuela. Como con la mayoría de las escuelas (primarias), la población de estudiantes se divide en aulas. Usted observa una respuesta binaria de n i niños en N clases (es decir, Σ N i = 1 n i respuestas binarias agrupados por clase), donde Y i j = 1 si el estudiante j de clase i pasó y Y i j = 0 si /ella falló. Y xY ni N ∑Ni=1ni Yij=1 j i Yij=0 si el estudiantejdel aulaies hombre y 0 en caso contrario.xij=1 j i
Para introducir la terminología que utilicé en el primer párrafo, puede pensar que la escuela es la población y que las aulas son las asignaturas .
Primero considere GLMM. GLMM está ajustando un modelo de efectos mixtos. Las condiciones del modelo en la matriz de diseño fijo (que en este caso se compone de la intercepción y el indicador de género) y cualquier efecto aleatorio entre las aulas que incluimos en el modelo. En nuestro ejemplo, incluyamos una intersección aleatoria, , que tendrá en cuenta las diferencias de referencia en la tasa de fracaso entre las aulas. Entonces estamos modelandobi
El odds ratio de riesgo de fracaso en el modelo anterior difiere en función del valor de que es diferente entre las aulas. Por lo tanto, las estimaciones son específicas del tema .bi
GEE, por otro lado, está ajustando un modelo marginal. Estos modelos promedios de población . Está modelando la expectativa condicional solo en su matriz de diseño fija.
Esto contrasta con los modelos de efectos mixtos, como se explicó anteriormente, que condicionan tanto la matriz de diseño fija como los efectos aleatorios. Entonces, con el modelo marginal anterior, usted dice: "olvídate de la diferencia entre las aulas, solo quiero la tasa de fracaso de la población (escolar) y su asociación con el género". Usted se ajusta al modelo y obtiene un cociente de probabilidades que es el cociente de probabilidades de falla promediado por la población asociado con el género.
Por lo tanto, puede encontrar que sus estimaciones de su modelo GEE pueden diferir de sus estimaciones de su modelo GLMM y eso se debe a que no están estimando lo mismo.
(En cuanto a la conversión de log-odds-ratio a odds-ratio exponiendo, sí, lo hace ya sea una estimación a nivel de población o específica del sujeto)
Algunas notas / literatura:
Para el caso lineal, el promedio poblacional y las estimaciones específicas por sujeto son las mismas.
Zeger y col. 1988 demostró que para la regresión logística,
donde son las estimaciones marginales, β R E son las estimaciones específicas del sujeto y V es la varianza de los efectos aleatorios.βM βRE V
Molenberghs, Verbeke 2005 tiene un capítulo completo sobre modelos de efectos marginales vs.
Aprendí sobre esto y material relacionado en un curso basado en Diggle, Heagerty, Liang, Zeger 2002 , una gran referencia.
fuente