Conciliación de anotaciones para modelos mixtos

12

Estoy familiarizado con la notación como:

yij=β0+βixij+uj+eij=β0j+βixij+eij
where , yβ0j=β0+uj

yij=β0+β1xij+u0j+u1jxij+eij=β0j+β1jxij+eij
donde y β 1 j = β 1 + u 1 jβ0j=β0+u0jβ1j=β1+u1j

para un modelo de intercepciones aleatorias y un modelo de pendiente aleatoria + intercepciones aleatorias, respectivamente.

También me he encontrado con esta notación de matriz / vector, que me han dicho que es "notación de modelo mixto para adultos" (según mi hermano mayor):

y=Xβ+Zb+e
donde son los efectos fijos y son los efectos aleatorios.bβb

Si he entendido correctamente, la última notación es una notación más general para la primera, que son versiones específicas de la segunda.

Me gustaría ver cómo se puede derivar lo primero de lo último.

Joe King
fuente
2
¿Estás preguntando por una explicación de la notación matricial? La razón por la que pregunto es que esta pregunta no necesita ninguna derivación matemática: todas sus fórmulas dicen exactamente las mismas cosas y relacionarlas entre sí es solo una cuestión de entender cómo funciona la notación matricial.
whuber
@whuber Entiendo la notación matricial y el álgebra matricial, hasta cierto punto. Pero no sé cómo comenzar desde la forma matricial y llegar a las otras formas. Probablemente no entiendo algo sobre las matrices X y Z, pero solo esperaba que alguien lo explicara.
Joe King
@whuber, ¿hay algo que pueda hacer para mejorar la pregunta, o estás diciendo que es tan básico que no merece una respuesta?
Joe King
@JoeKing: Creo que está diciendo que la notación matricial es, por definición, equivalente a su notación no matricial. Es decir, ya tiene (matriz ixj multiplicada por la matriz que produce la matriz ) que es . (Puede en incluyendo un 1 en ).y i y = X β β 0 β Xxijβiyiy=Xββ0βX
Wayne
2
@Wayne ambos modelos tienen efectos aleatorios y efectos fijos. El primero tiene una intersección aleatoria, mientras que el segundo tiene una intersección aleatoria y una pendiente aleatoria. ¡Si pudiera "resolverlo" yo mismo, no estaría haciendo la pregunta aquí!
Joe King

Respuestas:

13

Consideramos un modelo mixto con pendientes aleatorias e intercepciones aleatorias. Dado que solo tenemos un regresor, este modelo puede escribirse como donde denota la -ésima observación del grupo de la respuesta, y y el respectivo predictor y término de error.

yij=β0+β1xij+u0j+u1jxij+ϵij,
yijijxijϵij

Este modelo se puede expresar en notación matricial de la siguiente manera:

Y=Xβ+Zb+ϵ,
que es equivalente a

Y=[XZ][βb]+ϵ

Supongamos que tenemos grupos , es decir, y dejemos que denote el número de observaciones en el grupo . Particionado para cada grupo, podemos escribir la fórmula anterior comoJj=1,,Jnjj

[Y1Y2YJ]=[X1Z1000X20Z200XJ000ZJ][βb1b2bJ]+[ϵ1ϵ2ϵJ]

donde es una que contiene todas las observaciones de la respuesta para el grupo , y son matrices de diseño en este caso y es nuevamente una matriz.Yjnj×1jXjZjnj×2ϵjnj×1

Escribiéndolos, tenemos:

Yj=[y1jy2jynjj],Xj=Zj=[1x1j1x2j1xnjj] y ϵj=[ϵ1jϵ2jϵnjj].

Los vectores de coeficiente de regresión son entonces

β=(β0β1) , bj=(u0ju1j)

Para ver que las dos formulaciones modelo son de hecho equivalentes, veamos cualquiera de los grupos (digamos el -ésimo).j

Yj=Xjβ+Zjbj+ϵj

Aplicando las definiciones anteriores, se puede mostrar que la -ésima fila del vector resultante es solo donde varía de a .i

yij=β0+β1xij+u0j+u1jxij+ϵij,
i1nj
Philipp Burckhardt
fuente
2
+1, solo señalaría que existen grandes ventajas computacionales de implementar usando lugar de la matriz completa . El son básicamente una versión de almacenamiento de matriz dispersa de Z Z j ZZjZZjZ
probabilityislogic