¿Cuál es la diferencia entre ecuaciones de estimación generalizadas y GLMM?

Estoy ejecutando un GEE en datos no balanceados de 3 niveles, usando un enlace logit. ¿Cómo difiere esto (en términos de las conclusiones que puedo extraer y el significado de los coeficientes) de un GLM con efectos mixtos (GLMM) y un enlace logit?

Más detalles: Las observaciones son ensayos individuales de Bernoulli. Se agrupan agrupados en aulas y escuelas. Usando R. Casewise omisión de NAs. 6 predictores también términos de interacción.

(No estoy volteando a los niños para ver si aterrizan cara a cara).

Me inclino a exponer los coeficientes a odds-ratios. ¿Tiene esto el mismo significado en ambos?

Hay algo al acecho en mi mente sobre "medios marginales" en los modelos GEE. Necesito que me expliquen esa parte.

Gracias.

logistic mixed-model generalized-linear-model interpretation gee rosser
fuente

Las siguientes preguntas de CV también analizan este material: Diferencia entre modelos lineales generalizados y modelos lineales mixtos generalizados en SPSS ; ¿Cuándo usar ecuaciones de estimación generalizadas versus modelos de efectos mixtos? .

gung - Restablece a Monica

En cuanto a la interpretación de los coeficientes, hay una diferencia en el caso binario (entre otros). Lo que difiere entre GEE y GLMM es el objetivo de inferencia: promedio poblacional o específico del tema .

Consideremos un ejemplo inventado simple relacionado con el tuyo. Desea modelar la tasa de fracaso entre niños y niñas en una escuela. Como con la mayoría de las escuelas (primarias), la población de estudiantes se divide en aulas. Usted observa una respuesta binaria de niños en clases (es decir, respuestas binarias agrupados por clase), donde si el estudiante de clase pasó y si /ella falló. Y $Y$ $n_i$ $N$ $\sum_{i=1}^{N}n_{i}$ $Y_{ij}=1$ $j$ $i$ $Y_{ij}=0$ si el estudiantedel aulaes hombre y 0 en caso contrario. $x_{ij} =1$ $j$ $i$

Para introducir la terminología que utilicé en el primer párrafo, puede pensar que la escuela es la población y que las aulas son las asignaturas .

Primero considere GLMM. GLMM está ajustando un modelo de efectos mixtos. Las condiciones del modelo en la matriz de diseño fijo (que en este caso se compone de la intercepción y el indicador de género) y cualquier efecto aleatorio entre las aulas que incluimos en el modelo. En nuestro ejemplo, incluyamos una intersección aleatoria, , que tendrá en cuenta las diferencias de referencia en la tasa de fracaso entre las aulas. Entonces estamos modelando $b_i$

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}, b_i\right)=\beta_0+\beta_1 x_{ij} + b_i$

El odds ratio de riesgo de fracaso en el modelo anterior difiere en función del valor de que es diferente entre las aulas. Por lo tanto, las estimaciones son específicas del tema . $b_i$

GEE, por otro lado, está ajustando un modelo marginal. Estos modelos promedios de población . Está modelando la expectativa condicional solo en su matriz de diseño fija.

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}\right)=\beta_0+\beta_1 x_{ij}$

Esto contrasta con los modelos de efectos mixtos, como se explicó anteriormente, que condicionan tanto la matriz de diseño fija como los efectos aleatorios. Entonces, con el modelo marginal anterior, usted dice: "olvídate de la diferencia entre las aulas, solo quiero la tasa de fracaso de la población (escolar) y su asociación con el género". Usted se ajusta al modelo y obtiene un cociente de probabilidades que es el cociente de probabilidades de falla promediado por la población asociado con el género.

Por lo tanto, puede encontrar que sus estimaciones de su modelo GEE pueden diferir de sus estimaciones de su modelo GLMM y eso se debe a que no están estimando lo mismo.

(En cuanto a la conversión de log-odds-ratio a odds-ratio exponiendo, sí, lo hace ya sea una estimación a nivel de población o específica del sujeto)

Algunas notas / literatura:

Para el caso lineal, el promedio poblacional y las estimaciones específicas por sujeto son las mismas.

Zeger y col. 1988 demostró que para la regresión logística,

$\beta_M\approx \left[ \left(\frac{16\sqrt{3}}{15\pi }\right)^2 V+1\right]^{-1/2}\beta_{RE}$

donde son las estimaciones marginales, son las estimaciones específicas del sujeto y es la varianza de los efectos aleatorios. $\beta_M$ $\beta_{RE}$ $V$

Molenberghs, Verbeke 2005 tiene un capítulo completo sobre modelos de efectos marginales vs.

Aprendí sobre esto y material relacionado en un curso basado en Diggle, Heagerty, Liang, Zeger 2002 , una gran referencia.

fuente

Mike: ¿Es demasiado simple decir que un GEE está promediando sobre los efectos aleatorios?

B_Miner

@B_Miner No es demasiado simple en absoluto, eso es exactamente lo que estás haciendo :)

@ Mike Wierzbicki: ¡Respuesta agradable y limpia, Mike! Un pequeño detalle que podría agregar en su "Algunas notas / literatura": GEE y GLMM son los mismos en el caso lineal (respuesta gaussiana, enlace de identidad) solo cuando especifica una matriz de correlación intercambiable para el GEE.

¿No hay un GEE específico del tema, también?

giordano

@MikeWierzbicki Entonces, si te entiendo correctamente, un GEE no es más que un simple modelo de efectos mixtos sin efectos aleatorios (lo que lo convierte en una simple línea de regresión no lineal).

Robin Kramer

¿Cuál es la diferencia entre ecuaciones de estimación generalizadas y GLMM?

Respuestas: