Estoy tratando de entender cuándo usar un efecto aleatorio y cuándo es innecesario. Me han dicho que una regla de oro es si tienes 4 o más grupos / individuos que yo hago (15 alces individuales). Algunos de esos alces fueron experimentados 2 o 3 veces para un total de 29 ensayos. Quiero saber si se comportan de manera diferente cuando están en paisajes de mayor riesgo que no. Entonces, pensé que establecería al individuo como un efecto aleatorio. Sin embargo, ahora me dicen que no hay necesidad de incluir al individuo como un efecto aleatorio porque no hay mucha variación en su respuesta. Lo que no puedo entender es cómo probar si realmente hay algo que se tiene en cuenta al configurar el individuo como un efecto aleatorio. Tal vez una pregunta inicial es: ¿Qué prueba / diagnóstico puedo hacer para determinar si Individual es una buena variable explicativa y debería ser un efecto fijo - qq parcelas? histogramas? ¿gráfico de dispersión? ¿Y qué buscaría en esos patrones?
Ejecuté el modelo con el individuo como un efecto aleatorio y sin él, pero luego leí http://glmm.wikidot.com/faq donde dicen:
no compare los modelos lmer con los ajustes lm correspondientes, ni glmer / glm; las probabilidades de registro no son proporcionales (es decir, incluyen diferentes términos aditivos)
Y aquí supongo que esto significa que no se puede comparar entre un modelo con efecto aleatorio o sin él. Pero de todos modos no sabría realmente qué debo comparar entre ellos.
En mi modelo con efecto aleatorio, también estaba tratando de ver la salida para ver qué tipo de evidencia o importancia tiene el RE
lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv)
Linear mixed model fit by maximum likelihood
Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID)
Data: tv
AIC BIC logLik deviance REMLdev
-13.92 -7.087 11.96 -23.92 15.39
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 0.00000 0.00000
Residual 0.02566 0.16019
Number of obs: 29, groups: ID, 15
Fixed effects:
Estimate Std. Error t value
(Intercept) 3.287e-01 5.070e-02 6.483
D.CPC.min -1.539e-03 3.546e-04 -4.341
FD.CPC 1.153e-04 1.789e-05 6.446
Correlation of Fixed Effects:
(Intr) D.CPC.
D.CPC.min -0.010
FD.CPC -0.724 -0.437
Usted ve que mi varianza y SD de la ID individual como efecto aleatorio = 0. ¿Cómo es eso posible? ¿Qué significa 0? ¿Está bien? Entonces, ¿mi amigo que dijo "ya que no hay variación usando ID como efecto aleatorio es innecesario" es correcto? Entonces, ¿lo usaría como un efecto fijo? ¿Pero el hecho de que haya tan poca variación no significa que no nos va a decir mucho de todos modos?
Respuestas:
La estimación,
ID
la varianza = 0, indica que el nivel de variabilidad entre grupos no es suficiente para garantizar la incorporación de efectos aleatorios en el modelo; es decir. Su modelo es degenerado.Como te identificas correctamente: muy probablemente sí;
ID
como efecto aleatorio es innecesario Se te ocurren pocas cosas para probar esta suposición:REML = F
siempre) el AIC (o su IC favorito en general) entre un modelo con y sin efectos aleatorios y ver cómo funciona.anova()
salida de los dos modelos.Tenga en cuenta que las opciones 1 y 2 tienen un problema: está buscando algo que esté en los límites del espacio de parámetros, por lo que en realidad no son técnicamente sólidos. Habiendo dicho eso, no creo que obtengas ideas erróneas de ellos y mucha gente los use (por ejemplo, Douglas Bates, uno de los desarrolladores de lme4, los usa en su libro, pero establece claramente esta advertencia sobre los valores de los parámetros que se están probando en el límite del conjunto de valores posibles). La opción 3 es la más tediosa de las 3, pero en realidad te da la mejor idea de lo que está sucediendo. Algunas personas sienten la tentación de usar bootstrap no paramétrico también, pero creo que dado el hecho de que está haciendo suposiciones paramétricas para comenzar, también podría usarlas.
fuente
lme4
especialmente ahora quemcmcsamp()
está roto y las personas solo tienen sus propias implementaciones de arranque ad-hoc para obtener algunos valores p decentes, etc.No estoy seguro de que el enfoque que voy a sugerir sea razonable, por lo que aquellos que saben más sobre este tema me corrigen si me equivoco.
Mi propuesta es crear una columna adicional en sus datos que tenga un valor constante de 1:
Luego, puede crear un modelo que use esta columna como su efecto aleatorio:
En este punto, podría comparar (AIC) su modelo original con el efecto aleatorio
ID
(llamémoslofm0
) con el nuevo modelo que no tiene en cuenta,ID
ya queIDconst
es el mismo para todos sus datos.Actualizar
user11852 estaba pidiendo un ejemplo, porque en su opinión, el enfoque anterior ni siquiera se ejecutará. Por el contrario, puedo demostrar que el enfoque funciona (al menos con el
lme4_0.999999-0
que estoy usando actualmente).Salida:
Según esta última prueba, debemos mantener el efecto aleatorio ya que el
fm0
modelo tiene el AIC más bajo y el BIC.Actualización 2
Por cierto, este mismo enfoque es propuesto por NW Galwey en 'Introducción al modelado mixto: más allá de la regresión y el análisis de varianza' en las páginas 213-214.
fuente
IDconst
es igual para todos sus datos, entonces no tiene ninguna agrupación. Necesita un factor de agrupación para tener al menos un nivel muestreado y la forma en que configura el modelo no tiene ninguno. Tal vez podría creer la razón de usar una "agrupación aleatoria", pero ese es un juego de pelota diferente en conjunto. Pruebe su enfoque con algunos datos ficticios. Creo firmemente que con su configuración propuestalmer()
no se ejecutará. (Yo usolme4_0.99999911-1
)lme4_0.99999911-1
.Error in lFormula(formula = value ~ fac1 + (1 | idconst), data = dataset) : grouping factors must have at least 1 sampled level
. Y como dije, conceptualmente está mal. No se trata de engañar al software para que entregue algunos números, se trata de si lo que usted dice es razonable. No tiene un segundo modelo mixto para comparar si en ese modelo el efecto aleatorio es, por construcción, una constante. También podría excluirlo e intentar un modelo lineal en su lugar.lme4
. Esto se puede hacer si se establece la opción:control=lmerControl(check.nlev.gtr.1="ignore")
. Ben Bolker lo menciona aquí: github.com/lme4/lme4/issues/411 .Me gustaría responder la pregunta más "inicial".
Si sospecha que existe algún tipo de heterogeneidad en la variación entre cualquiera de las variables dependientes debido a algunos factores, debe continuar y graficar los datos utilizando diagramas de dispersión y de caja. Algunos patrones comunes para verificar, pongo esta lista a continuación de varias fuentes en la web.
Además, trace su variable dependiente por grupos de factor / tratamiento para ver si hay una varianza constante. De lo contrario, es posible que desee explorar efectos aleatorios o regresiones ponderadas. Por ej. Este cuadro a continuación es un ejemplo de una variación en forma de embudo en mis grupos de tratamiento. Así que elijo ir a los efectos aleatorios y probar los efectos en pendientes e intersecciones.
A partir de aquí, las respuestas anteriores responden a su pregunta principal. También hay pruebas que verifican la heterocedasticidad, una de ellas está aquí: https://dergipark.org.tr/download/article-file/94971 . Pero no estoy seguro de si existen pruebas para detectar la heterocedasticidad a nivel de grupo.
fuente
ASK QUESTION
en la parte superior y pregúntela allí. Como eres nuevo aquí, es posible que quieras hacer nuestro recorrido , que tiene información para nuevos usuarios.