He estado usando el MCMCglmm
paquete recientemente. Estoy confundido por lo que se refiere en la documentación como estructura R y estructura G. Estos parecen relacionarse con los efectos aleatorios, en particular especificando los parámetros para la distribución previa sobre ellos, pero la discusión en la documentación parece suponer que el lector sabe cuáles son estos términos. Por ejemplo:
lista opcional de especificaciones previas que tienen 3 elementos posibles: R (estructura R) G (estructura G) y B (efectos fijos) ............ Los antecedentes de las estructuras de varianza (R y G ) son listas con las (co) varianzas esperadas (V) y el parámetro de grado de creencia (nu) para el inverso-Wishart
... tomado de aquí .
EDITAR: Tenga en cuenta que he reescrito el resto de la pregunta después de los comentarios de Stephane.
¿Alguien puede arrojar luz sobre lo que son la estructura R y la estructura G, en el contexto de un modelo de componentes de varianza simple donde el predictor lineal es con y
Hice el siguiente ejemplo con algunos datos que vienen con MCMCglmm
> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8529 0.2951 1.455 160
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 1 1 1 0
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1630 -1.4558 -0.8119 463.1 <0.001 ***
---
> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8325 0.3101 1.438 79.25
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 0.7212 0.04808 2.427 3.125
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1042 -1.5191 -0.7078 20.99 <0.001 ***
---
> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation
Formula: Pupated ~ 1 + (1 | FSfamily)
Data: PlodiaRB
AIC BIC logLik deviance
1020 1029 -508 1016
Random effects:
Groups Name Variance Std.Dev.
FSfamily (Intercept) 0.56023 0.74849
Number of obs: 874, groups: FSfamily, 49
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.9861 0.1344 -7.336 2.2e-13 ***
Entonces, según los comentarios de Stephane, creo que la estructura G es para . Pero los comentarios también dicen que la estructura R es para pero esto no parece aparecer en la salida.lme4
Tenga en cuenta que los resultados lme4/glmer()
son consistentes con ambos ejemplos de MCMC MCMCglmm
.
Entonces, ¿es la estructura R para y por qué no aparece esto en la salida para ?lme4/glmer()
fuente
lme4
Respuestas:
Preferiría publicar mis comentarios a continuación como un comentario, pero esto no sería suficiente. Estas son preguntas en lugar de una respuesta (de manera similar a @gung, no me siento lo suficientemente fuerte sobre el tema).
Tengo la impresión de que MCMCglmm no implementa un "mmm" bayesiano "verdadero". El verdadero modelo bayesiano se describe en la sección 2 de este documento . De manera similar al modelo frecuentista, uno tiene y hay un requisito previo en el parámetro de dispersión ϕ 1 además de los parámetros fijos β y la varianza "G" de la efecto aleatorio u .g(E(y∣u))=Xβ+Zu ϕ1 β u
Pero de acuerdo con esta viñeta MCMCglmm , el modelo implementado en MCMCglmm viene dado por , y no involucra el parámetro de dispersión ϕ 1 . No es similar al modelo frecuentista clásico.g(E(y∣u,e))=Xβ+Zu+e ϕ1
Por lo tanto, no me sorprendería que no haya un análogo de con glmer.σe
Por favor, discúlpate por estos comentarios, solo eché un vistazo rápido al respecto.
fuente
glmer
MCMCglmm
MCMCglmm
MCMCglmm
usar una variedad de parámetros, y los intervalos creíbles del 95% siempre contienen el valor de varianza para la estimación de efectos aleatorios porglmer
lo que sentí que esto era razonable , pero ¿cómo debo interpretar este caso, que puede no ser típico, donde el resultado es que losMCMCglmm
intervalos no son muy sensibles a la elección de antes? ¿Tal vez debería hacer una nueva pregunta sobre esto?glmer
Una nota final, debido a que la varianza residual no está fijada en cero, las estimaciones no coincidirán con las de
glmer
. Necesitas reescalarlos. Aquí hay un pequeño ejemplo (no usa efectos aleatorios, pero generaliza). Observe cómo la varianza de la estructura R se fija en 1.Aquí está la constante de reescalado para la familia binomial:
Ahora divide la solución entre ella y obtén los modos posteriores
Que debería estar bastante cerca de lo que obtenemos de
glm
fuente
123
, obtengo (con la corrección) dem2
los valores-8.164
y0.421
; y deglm
los valores-8.833
y0.430
.