Me pregunto cuáles son las diferencias entre GLM mixtos y no mezclados. Por ejemplo, en SPSS, el menú desplegable permite a los usuarios ajustar:
analyze-> generalized linear models-> generalized linear models
Yanalyze-> mixed models-> generalized linear
¿Tratan los valores perdidos de manera diferente?
Mi variable dependiente es binaria y tengo varias variables independientes categóricas y continuas.
mixed-model
generalized-linear-model
glmm
gee
usuario9203
fuente
fuente
Respuestas:
El advenimiento de los modelos lineales generalizados nos ha permitido construir modelos de datos de tipo regresión cuando la distribución de la variable de respuesta no es normal, por ejemplo, cuando su DV es binario. (Si desea saber un poco más sobre GLiM, escribí una respuesta bastante extensa aquí , que puede ser útil aunque el contexto difiera). Sin embargo, un GLiM, por ejemplo, un modelo de regresión logística, supone que sus datos son independientes . Por ejemplo, imagine un estudio que analiza si un niño ha desarrollado asma. Cada niño aporta unolos datos apuntan al estudio: tienen asma o no. Sin embargo, a veces los datos no son independientes. Considere otro estudio que analiza si un niño tiene un resfriado en varios puntos durante el año escolar. En este caso, cada niño aporta muchos puntos de datos. Hubo un tiempo en que un niño tenía un resfriado, luego no, y aún más tarde podría tener otro resfriado. Estos datos no son independientes porque provienen del mismo niño. Para analizar adecuadamente estos datos, debemos tener en cuenta de alguna manera esta no independencia. Hay dos formas: una es utilizar las ecuaciones de estimación generalizadas (que no menciona, por lo que omitiremos). La otra forma es utilizar un modelo mixto lineal generalizado.. Los GLiMM pueden dar cuenta de la no independencia al agregar efectos aleatorios (como señala @MichaelChernick). Por lo tanto, la respuesta es que su segunda opción es para datos repetidos de medidas no normales (o de otra manera no independientes). (I debería mencionar, de acuerdo con comentario de @ Macro, que general- ized lineal modelos mixtos incluyen modelos lineales como un caso especial y por lo tanto puede ser utilizado con datos distribuidos normalmente. Sin embargo, en el uso típico el término connota de datos no normales).
Actualización: (El OP también ha preguntado sobre GEE, por lo que escribiré un poco sobre cómo se relacionan los tres).
Aquí hay una descripción básica:
Como tiene varias pruebas por participante, sus datos no son independientes; Como bien ha notado, "los ensayos dentro de un participante probablemente sean más similares que en todo el grupo". Por lo tanto, debe usar GLMM o GEE.
El problema, entonces, es cómo elegir si GLMM o GEE serían más apropiados para su situación. La respuesta a esta pregunta depende del tema de su investigación, específicamente, el objetivo de las inferencias que espera hacer. Como dije anteriormente, con un GLMM, las versiones beta le informan sobre el efecto de un cambio de una unidad en sus covariables en un participante en particular, dadas sus características individuales. Por otro lado, con el GEE, las versiones beta le informan sobre el efecto de un cambio de una unidad en sus covariables sobre el promedio de las respuestas de toda la población en cuestión. Esta es una distinción difícil de entender, especialmente porque no existe tal distinción con los modelos lineales (en cuyo caso los dos son lo mismo).
Una forma de tratar de comprender esto es imaginar un promedio sobre su población en ambos lados del signo igual en su modelo. Por ejemplo, este podría ser un modelo: donde: Hay un parámetro que gobierna la distribución de la respuesta ( , la probabilidad, con datos binarios) en el lado izquierdo para cada participante. En el lado derecho, hay coeficientes para el efecto de la covariable [s] y el nivel de línea base cuando la covariable [s] es igual a 0. Lo primero que debe notar es que la intercepción real para cualquier individuo específico no es , sino más bien logit ( p ) = ln ( p
Imagine que esta gráfica representa el proceso de generación de datos subyacente para la probabilidad de que una clase pequeña de los estudiantes podrán aprobar un examen sobre alguna materia con un número determinado de horas de instrucción sobre ese tema. Cada una de las curvas grises representa la probabilidad de aprobar el examen con diferentes cantidades de instrucción para uno de los estudiantes. La curva en negrita es el promedio de toda la clase. En este caso, el efecto de una hora adicional de enseñanza condicional en los atributos del alumno es
La pregunta de si debe usar un GLMM o el GEE es la pregunta de cuáles de estas funciones desea estimar. Si desea saber acerca de la probabilidad de que un alumno fallezca (si, por ejemplo, usted era el alumno o el padre del alumno), desea utilizar un GLMM. Por otro lado, si desea saber sobre el efecto en la población (si, por ejemplo, usted fuera el maestro o el director), querría usar el GEE.
Para otra discusión, más matemáticamente detallada, de este material, vea esta respuesta de @Macro.
fuente
La clave es la introducción de efectos aleatorios. El enlace de Gung lo menciona. Pero creo que debería haber sido mencionado directamente. Esa es la principal diferencia.
fuente
Le sugiero que también examine las respuestas de una pregunta que hice hace algún tiempo:
Modelo lineal general versus modelo lineal generalizado (¿con una función de enlace de identidad?)
fuente