Interpretación de la varianza del efecto aleatorio en glmer

13

Estoy revisando un documento sobre polinización, donde los datos se distribuyen binomialmente (la fruta madura o no). Así que usé glmercon un efecto aleatorio (planta individual) y un efecto fijo (tratamiento). Un revisor quiere saber si la planta tuvo un efecto en el conjunto de frutos, pero tengo problemas para interpretar los glmerresultados.

He leído en la web y parece que puede haber problemas con la comparación directa glmy los glmermodelos, por lo que no estoy haciendo eso. Pensé que la forma más directa de responder la pregunta sería comparar la varianza del efecto aleatorio (1.449, a continuación) con la varianza total, o la varianza explicada por el tratamiento. Pero, ¿cómo calculo estas otras variaciones? No parecen estar incluidos en el resultado a continuación. Leí algo sobre las variaciones residuales que no se incluyen para el binomio glmer: ¿cómo interpreto la importancia relativa del efecto aleatorio?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

r generalized-linear-model variance lme4-nlme ecology jwb4
fuente

12

Si bien, en principio, es posible obtener un análogo de "variación de proporción explicada por cada efecto" para los GLMM, hay varios factores complicados (qué niveles del modelo considera "variación total" y cómo cuantifica la variación de muestreo debido a la distribución de muestreo de nivel más bajo [Binomial en este caso])? Nakagawa y Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) presentan un enfoque general para calcular R ^ 2 (se explica la proporción de la varianza total) para (G) LMM que se ha vuelto bastante popular en ecología; Xu et al 2003Adopta un enfoque similar. En principio, este enfoque probablemente podría extenderse para considerar la proporción de varianza explicada por diferentes términos [pero tenga en cuenta que la 'proporción de varianza' de todos los términos en el modelo considerado de esta manera probablemente no sumaría hasta el 100%; podría ser más o menos].

$4\sigma$ $-1.96 \sigma$ $+1.96\sigma$

Visualmente:

ingrese la descripción de la imagen aquí

Ben Bolker
fuente

R^{2}

$R^2$

1

Solo decía que no creo que sea una pregunta loca o necesariamente mal planteada. Pero tanto la estructura jerárquica como los modelos similares a GLM abren latas de gusanos que hacen que sea más difícil elegir una respuesta. Por lo general, no me molesto, pero puedo ver por qué la gente querría intentar encontrar números que midieran la bondad de ajuste, o la importancia relativa de los términos en un modelo, de una manera razonable.

Ben Bolker

Es razonable. Por cierto, ¿qué opinas de mi sugerencia de que con 10 plantas, 3 tratamientos y N = 30, el OP podría ajustarse a un modelo utilizando ambos como efectos fijos? No creo necesariamente que este sea el modelo final correcto, por supuesto, pero me parece una forma potencialmente permisible de probar si hay variación entre las plantas y poner ambas variables en una base similar para la comparación.

gung - Restablece a Monica

me parece razonable

Ben Bolker

Encajé un modelo con Tratamiento y Planta como efectos fijos como sugirió el gung, y el término Planta tenía un valor p muy alto (p = 0.3). ¿Esto parece extraño dado que, como usted dice, "la desviación estándar estimada entre plantas es 1.20, muy cercana a la magnitud del mayor efecto de tratamiento (-1.18)"? ¿Por qué aparecería como insignificante en un ANOVA con 2 efectos fijos?

jwb4

3

PlantID $0$

En su caso, tiene múltiples medidas por planta, por lo que un enfoque rápido y sucio es ejecutar un modelo con PlantIDun efecto fijo y probar ese efecto.

gung - Restablece a Monica
fuente

1

La respuesta simple a su revisor es: "Sí". Si le pide que pruebe si la varianza del efecto aleatorio es significativamente diferente de 0, tiene un par de opciones. Sin embargo, tenga en cuenta que muchas personas inteligentes se sienten incómodas con las pruebas si las variaciones de los efectos aleatorios son diferentes de 0.

Más simple es una prueba de razón de probabilidad, aunque no es recomendada por la mayoría. Son muy conservadores cuando se realizan pruebas en los límites (es decir, se realizan pruebas con una varianza de 0 que es lo más baja posible). Existe una regla general que dice que el valor p es aproximadamente el doble de lo que realmente es.

El método recomendado en la mayoría de los lugares es un bootstrap paramétrico. Puedes usar bootMerdesde el lme4paquete. Asegúrese de establecer el parámetro REML de su función lmer en FALSE, de lo contrario, su varianza será mayor que 0 100% del tiempo (o cerca de él ... en realidad, probablemente será mayor que 0, casi el 100% de la tiempo de todos modos).

Algunos consejos y más recursos:

http://glmm.wikidot.com/faq (encuentre el título ¿Cómo puedo probar si un efecto aleatorio es significativo?)

Prueba de arranque paramétrica lmer () para efectos fijos

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/

le_andrew
fuente

Gracias por esta guía lúcida (¡y rápida!) Para la comparación de modelos. Pero, ¿cómo interpretaría la "magnitud" del efecto de la variable aleatoria? es decir, ¿cómo compararía la varianza explicada por mi variable aleatoria con la varianza explicada por la variable fija (tratamiento)? Supongo que no veo cómo esto se deduce de los resultados de la prueba LRT bootstrapped.

jwb4

0

En la prueba Q de Cochran de muestras múltiples , usan anova para comparar los resultados de los dos modelos (uno sin efectos aleatorios y otro con efectos aleatorios).

Jairo Rocha Universidad de las Islas Baleares

Jairo Rocha
fuente

Interpretación de la varianza del efecto aleatorio en glmer

Respuestas: