He estado bastante feliz usando modelos de efectos mixtos desde hace un tiempo con datos longitudinales. Desearía poder encajar las relaciones AR en lmer (creo que tengo razón en que no puedo hacer esto), pero no creo que sea desesperadamente importante, así que no me preocupo demasiado.
Acabo de encontrar ecuaciones de estimación generalizadas (GEE), y parecen ofrecer mucha más flexibilidad que los modelos ME.
A riesgo de hacer una pregunta general, ¿hay algún consejo sobre cuál es mejor para diferentes tareas? He visto algunos papeles comparándolos, y tienden a ser de la forma:
"En esta área altamente especializada, no use GEE para X, no use modelos ME para Y".
No he encontrado más consejos generales. ¿Alguien puede iluminarme?
¡Gracias!
mixed-model
gee
Chris Beeley
fuente
fuente
glmmPQL
también puede ajustarse a las estructuras de correlación ARRespuestas:
Use GEE cuando esté interesado en descubrir el efecto promedio poblacional de una covariable versus el efecto específico individual. Estas dos cosas solo son equivalentes en modelos lineales, pero no en no lineales (por ejemplo, logística). Para ver esto, tomemos, por ejemplo, el modelo logístico de efectos aleatorios de la observación 'del sujeto , ;j i Yij
donde es un efecto aleatorio para el sujeto y .ηi∼N(0,σ2) i pij=P(Yij=1|ηi)
Si usó un modelo de efectos aleatorios en estos datos, obtendría una estimación de que explica el hecho de que se aplicó una perturbación media distribuida normalmente cero a cada individuo, haciéndola específica individual.μ
Si utilizó GEE en estos datos, estimaría las probabilidades de registro promedio de la población. En este caso eso sería
Editar: en general, un modelo de efectos mixtos sin predictores se puede escribir como
donde es una función de enlace. Cuandoψ
habrá una diferencia entre los coeficientes promedio de la población (GEE) y los coeficientes específicos individuales (modelos de efectos aleatorios). Es decir, los promedios cambian transformando los datos, integrando los efectos aleatorios en la escala transformada y luego transformando de nuevo. Tenga en cuenta que en el modelo lineal, (es decir, ), la igualdad se mantiene, por lo que son equivalentes.ψ(x)=x
Edición 2: También vale la pena señalar que los errores estándar "robustos" de tipo sandwich producidos por un modelo GEE proporcionan intervalos de confianza asintóticos válidos (por ejemplo, en realidad cubren el 95% del tiempo) incluso si la estructura de correlación especificada en el modelo no es correcto.
Edición 3: si su interés es comprender la estructura de asociación en los datos, las estimaciones de asociaciones de GEE son notoriamente ineficientes (y a veces inconsistentes). He visto una referencia para esto, pero no puedo ubicarla ahora.
fuente
En mi opinión, GEE es más útil cuando no estamos utilizando el modelado bayesiano y cuando no hay una solución de probabilidad completa disponible. Además, GEE puede requerir tamaños de muestra más grandes para ser lo suficientemente precisos, y es muy poco robusto o no hay datos longitudinales que faltan al azar. GEE supone que falta completamente al azar, mientras que los métodos de probabilidad (modelos de efectos mixtos o mínimos cuadrados generalizados, por ejemplo) suponen que solo faltan al azar.
fuente
Puede encontrar una discusión exhaustiva y ejemplos concretos en Fitzmaurice, Laird y Ware, Análisis Longitudinal Aplicado , John Wiley & Sons, 2011, 2da edición, Capítulos 11-16.
En cuanto a los ejemplos, puede encontrar conjuntos de datos y programas SAS / Stata / R en el sitio web complementario .
fuente