¿Cuál sería una imagen ilustrativa para modelos lineales mixtos?

Digamos que está en la biblioteca de su departamento de estadística y que se encuentra con un libro con la siguiente imagen en la portada.

ingrese la descripción de la imagen aquí

Probablemente pensarás que este es un libro sobre cosas de regresión lineal.

¿Cuál sería la imagen que te haría pensar en modelos lineales mixtos?

mixed-model ocram
fuente

Respuestas:

Para una charla, he usado la siguiente imagen que se basa en el sleepstudyconjunto de datos del paquete lme4 . La idea era ilustrar la diferencia entre los ajustes de regresión independientes de los datos específicos del sujeto (gris) versus las predicciones de los modelos de efectos aleatorios, especialmente que (1) los valores pronosticados del modelo de efectos aleatorios son estimadores de contracción y que (2) las trayectorias individuales comparten una pendiente común con un modelo de solo intercepción aleatoria (naranja). Las distribuciones de las intersecciones de sujetos se muestran como estimaciones de densidad del núcleo en el eje y ( código R ).

ingrese la descripción de la imagen aquí
_{(Las curvas de densidad se extienden más allá del rango de valores observados porque hay relativamente pocas observaciones).}

Un gráfico más 'convencional' podría ser el siguiente, que es de Doug Bates (disponible en el sitio R-forge para lme4 , por ejemplo, 4Longitudinal.R ), donde podríamos agregar datos individuales en cada panel.

ingrese la descripción de la imagen aquí

chl
fuente

+1. Bueno uno! Creo que tu primera trama es genial a nivel conceptual. Mi único comentario sería que requiere mucha más explicación que una trama "ingenua" estándar y si la audiencia no está al día con los conceptos de los modelos LME y los datos longitudinales, podría perder el sentido de la trama. Sin embargo, definitivamente lo recordaré para una sólida "charla de estadísticas". (Ya he visto la segunda trama en el "libro lme4" un par de veces. No estaba demasiado impresionado entonces y tampoco estoy demasiado impresionado ahora.)

usεr11852 dice Reinstate Monic

@chl: ¡Gracias! Elegiré entre las propuestas. Mientras tanto, +1

ocram

@ user11852 Mi comprensión del modelo RI es que las estimaciones de OLS son correctas, pero sus errores estándar no lo son (debido a la falta de independencia), por lo que las predicciones individuales también serán incorrectas. Por lo general, mostraría la línea de regresión general suponiendo observaciones independientes. Luego, la teoría nos dice que la combinación de modos condicionales de los efectos aleatorios y las estimaciones de los efectos fijos produce modos condicionales de los coeficientes dentro del sujeto, y habrá poca grieta cuando las unidades estadísticas son diferentes, o cuando las mediciones son precisas, o con Muestras grandes.

chl

y | γ \sim N (X β + Z γ, σ^{2} I)

$y|\gamma \sim N(X\beta + Z\gamma, \sigma^2 I)$

y \sim N (X β, Z D Z^{T} + σ^{2} I)

$y \sim N(X\beta, ZDZ^T + \sigma^2 I)$

El enlace al código R para crear la imagen está roto. Me interesaría cómo dibujar las distribuciones verticalmente en la figura.

Niels Hameleers

Entonces, algo no "extremadamente elegante" pero que también muestra intercepciones aleatorias y pendientes con R. (supongo que sería aún más genial si mostrara las ecuaciones reales también) ingrese la descripción de la imagen aquí

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

usεr11852 dice Reinstate Monic
fuente

¡Gracias! Espero un poco más para posibles nuevas respuestas ... pero podría aprovechar esta.

ocram

Estoy un poco confundido por su figura, porque la subtrama correcta me parece que una línea de regresión separada se ajusta a cada grupo. ¿No es el punto que los ajustes de modelos mixtos deberían ser diferentes de los ajustes independientes por grupo? Tal vez lo son, pero en este ejemplo es realmente difícil de notar, ¿o me estoy perdiendo algo?

ameba dice Reinstate Monica

Sí, los coeficientes son diferentes . No; una regresión separada no fue adecuada para cada grupo. Se muestran los ajustes condicionales. En un diseño perfectamente equilibrado, homoskedastic como este, la diferencia será difícil de notar, por ejemplo, la intercepción condicional del grupo 5 es 2.96 mientras que la intercepción independiente por grupo es 3.00. Es la estructura de covarianza de error la que está cambiando. Verifique también la respuesta de Chi, tiene más grupos, pero incluso en muy pocos casos el ajuste es "muy diferente" visualmente.

usεr11852 dice Reinstate Monic

No es mi trabajo

Este gráfico tomado de la documentación de Matlab de nlmefit me parece realmente un ejemplo del concepto de intercepciones aleatorias y pendientes, obviamente. Probablemente, algo que muestre grupos de heterocedasticidad en los residuos de un gráfico OLS también sería bastante estándar, pero no daría una "solución".

usεr11852 dice Reinstate Monic
fuente

Gracias por tu sugerencia. Aunque parezca cosas de regresión logística mixta, creo que puedo adaptarlo fácilmente. Espero más sugerencias. Mientras tanto, +1. Gracias de nuevo.

ocram

Parece una regresión logística mixta sobre todo porque es una ... :) ¡Sin embargo, fue la primera trama que realmente se me ocurrió! Daré algo puramente R-ish en una segunda respuesta.

usεr11852 dice Reinstate Monic