¿Cómo interpreto la varianza del efecto aleatorio en un modelo mixto lineal generalizado?

9

En un modelo mixto lineal generalizado logístico (familia = binomio), no sé cómo interpretar la varianza de los efectos aleatorios:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

¿Cómo interpreto este resultado numérico?

Tengo una muestra de pacientes trasplantados renales en un estudio multicéntrico. Estaba probando si la probabilidad de que un paciente sea tratado con un tratamiento antihipertensivo específico sea la misma entre los centros. La proporción de pacientes tratados varía mucho entre los centros, pero puede deberse a diferencias en las características basales de los pacientes. Entonces estimé un modelo mixto lineal generalizado (logístico), ajustándome a las características principales de los patrones. Estos son los resultados:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Las variables cuantitativas están centradas. Sé que la desviación estándar entre hospitales de la intercepción es 0.6554, en la escala de probabilidades de registro. Debido a que la intersección es -1.804469, en la escala de probabilidades logarítmicas, la probabilidad de ser tratado con el antihipertensivo de un hombre, de edad promedio, con valor promedio en todas las variables y el inmuno tratamiento A, para un centro "promedio", es 14.1% . Y ahora comienza la interpretación: bajo el supuesto de que los efectos aleatorios siguen una distribución normal, esperaríamos que aproximadamente el 95% de los centros tengan un valor dentro de 2 desviaciones estándar de la media de cero, por lo que la probabilidad de ser tratado por el hombre promedio variará entre los centros con un intervalo de cobertura de:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

¿Es esto correcto?

Además, ¿cómo puedo probar en glmer si la variabilidad entre centros es estadísticamente significativa? Solía ​​trabajar con MIXNO, un excelente software de Donald Hedeker, y allí tengo un error estándar de la variación estimada, que no tengo en glmer. ¿Cómo puedo tener la probabilidad de ser tratado por el hombre "promedio" en cada centro, con un intervalo de confianza?

Gracias

usuario2310909
fuente

Respuestas:

10

0.65542=0.4295

(Si aclara su pregunta / agrega más detalles sobre su modelo, puedo intentar decir más).

actualización : su interpretación de la variación parece correcta. Más precisamente,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

debería darle el intervalo del 95% (no realmente intervalos de confianza, pero muy similares) para las probabilidades de que un individuo de referencia (hombre / edad promedio / etc.) reciba tratamiento en todos los hospitales.

Para probar la importancia del efecto aleatorio, tiene una variedad de opciones (consulte http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html para obtener más información). (Tenga en cuenta que el error estándar de una varianza RE generalmente no es una forma confiable de evaluar la significancia, ya que la distribución del muestreo a menudo está sesgada / no es normal). El enfoque más simple es hacer una prueba de razón de probabilidad, por ej.

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

La división final por 2 corrige el hecho de que la prueba de razón de probabilidad es conservadora cuando el valor nulo (es decir, la varianza RE = 0) está en el límite del espacio factible (es decir, la varianza RE no puede ser <0).

Ben Bolker
fuente
Edité la pregunta
usuario2310909
1
Gracias, es un placer leerle a alguien que conoce bien el tema.
usuario2310909