¿Por qué los modelos de efectos mixtos resuelven la dependencia?

Digamos que estamos interesados en cómo las calificaciones de los exámenes de los estudiantes se ven afectadas por la cantidad de horas que esos estudiantes estudian. Para explorar esta relación, podríamos ejecutar la siguiente regresión lineal:

{exam.grades}_{i} = a + β_{1} \times {hours.studied}_{i} + e_{i}

$\text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i$

Pero si tomamos muestras de alumnos de varias escuelas diferentes, podríamos esperar que los alumnos de la misma escuela sean más similares entre sí que los alumnos de diferentes escuelas. Para tratar este problema de dependencia, el consejo en muchos libros de texto / en la web es ejecutar efectos mixtos e ingresar a la escuela como un efecto aleatorio. Entonces el modelo se convertiría en: Pero, ¿por qué esto resuelve el problema de dependencia que estaba presente en la regresión lineal?

{exam.grades}_{i} = a + β_{1} \times {hours.studied}_{i} + {school}_{j} + e_{yo}

$\text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + \text{school}_j + e_i$

Responda como si estuviera hablando con un niño de 12 años.

regression mixed-model random-effects-model non-independent luciano
fuente

Si "resuelve" el problema de dependencia es específico del contexto. Pero probablemente pueda ver que ahora el modelo extendido tiene un término que puede, al menos parcialmente, explicar un efecto relacionado con una escuela en particular.

image_doctor

Incluir términos aleatorios en el modelo es una forma de inducir alguna estructura de covarianza entre los grados. El factor aleatorio para la escuela induce una covarianza diferente de cero entre diferentes estudiantes de la misma escuela, mientras que es cuando la escuela es diferente. $0$

Escribamos su modelo como donde indexa la escuela e indexa los alumnos (en cada escuela). Los términos son variables aleatorias independientes dibujadas en una . Las son variables aleatorias independientes dibujadas en una .

Y_{s, i} = α + {hours}_{s, i} β + {school}_{s} + e_{s, i}

$Y_{s,i} = \alpha + \text{hours}_{s,i} \beta + \text{school}_s + e_{s, i}$

s

$s$

i

$i$

{school}_{s}

$\text{school}_s$

N (0, τ)

$\mathcal N(0, \tau)$

e_{s, i}

$e_{s, i}$

N (0, σ^{2})

$\mathcal N(0, \sigma^2)$

Este vector tiene un valor esperado que está determinado por el número de horas trabajadas.

{[α + {horas}_{s, yo} β]}_{s, yo}

$\left[ \alpha + \text{hours}_{s,i} \beta \right]_{s,i}$

La covarianza entre e es cuando , lo que significa que la desviación de las calificaciones de los valores esperados son independientes cuando los estudiantes no están en la misma escuela. $Y_{s,i}$ $Y_{s',i'}$ $0$ $s \ne s'$

La covarianza entre e es cuando , y la varianza de es : las calificaciones de los estudiantes de la misma escuela tendrán desviaciones correlacionadas de sus valores esperados . $Y_{s,i}$ $Y_{s,i'}$ $\tau$ $i \ne i'$ $Y_{s,i}$ $\tau + \sigma^2$

Ejemplo y datos simulados

Aquí hay una breve simulación R para cincuenta estudiantes de cinco escuelas (aquí tomo ); los nombres de la variable son auto documentados: $\sigma^2 = \tau = 1$

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

Trazamos las desviaciones de la calificación esperada para cada estudiante, es decir, los términos , junto con (línea de puntos) la desviación media para cada escuela: $\text{school}_s + e_{s, i}$

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

modelo mixto

Ahora comentemos esta trama. El nivel de cada línea de puntos (que corresponde a ) se extrae al azar en una ley normal. Los términos aleatorios específicos del alumno también se dibujan al azar en una ley normal, corresponden a la distancia de los puntos desde la línea punteada. El valor resultante es, para cada estudiante, la salida de , la calificación determinada por el tiempo dedicado al trabajo. Como resultado, los alumnos en la misma escuela son más similares entre sí que los alumnos de diferentes escuelas, como usted indicó en su pregunta. $\text{school}_s$ $\alpha + \text{hours} \beta$

La matriz de varianza para este ejemplo

En las simulaciones anteriores dibujamos la escuela por separado los efectos y los efectos individuales , por lo que las consideraciones de covarianza con la que empecé no aparecen claramente aquí. De hecho, habríamos obtenido resultados similares al dibujar un vector normal aleatorio de dimensión 50 con matriz de covarianza de bloque diagonal donde cada uno de los cinco $\text{school}_s$ $e_{s,i}$

[\begin{matrix} UN & 0 0 & 0 0 & 0 0 & 0 0 \\ 0 0 & UN & 0 0 & 0 0 & 0 0 \\ 0 0 & 0 0 & UN & 0 0 & 0 0 \\ 0 0 & 0 0 & 0 0 & UN & 0 0 \\ 0 0 & 0 0 & 0 0 & 0 0 & UN \end{matrix}]

$\left[\begin{matrix} A & 0 & 0 & 0 & 0 \\ 0 & A & 0 & 0 & 0 \\ 0 & 0 & A & 0 & 0 \\ 0 & 0 & 0 & A & 0 \\ 0 & 0 & 0 & 0 & A \end{matrix}\right]$

bloques

corresponden a la covarianza entre los estudiantes de una misma escuela:

10 \times 10

$10\times 10$

A

$A$

UN = [\begin{matrix} 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 \end{matrix}] .

$A = \left[\begin{matrix} 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1\\ 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1\\ 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1 & 1\\ 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1 & 1\\ 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1 & 1\\ 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1 & 1\\ 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1 & 1\\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1 & 1\\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 & 1\\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 2 \end{matrix}\right].$

Elvis
fuente

Elvis: esa es probablemente una gran respuesta para las personas más versátiles en estadística que yo. Sin embargo, puedo extraer poco significado de ello. ¿Podría editar su respuesta de una manera que un niño de 12 años pueda entender?

luciano

¿A ... 12 años? ¡Guauu! Agregaré algunas simulaciones, si esto puede ayudar.

Elvis

Hecho. Espero que esto ayude. De lo contrario, sea más específico sobre lo que no obtiene. Tenga en cuenta que un niño de 12 años tampoco entendería la pregunta ... no puede pedir una respuesta más simple que la pregunta.

Elvis

¿Por qué los modelos de efectos mixtos resuelven la dependencia?

Respuestas: