En la práctica, ¿cómo se calcula la matriz de covarianza de efectos aleatorios en un modelo de efectos mixtos?

19

Básicamente, me pregunto cómo se aplican las diferentes estructuras de covarianza y cómo se calculan los valores dentro de estas matrices. Funciones como lme () nos permiten elegir qué estructura nos gustaría, pero me encantaría saber cómo se estiman.

Considere el modelo de efectos lineales mixtos Y=Xβ+Zu+ϵ .

Donde udN(0,D) y . Además:ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Por simplicidad asumiremos .R=σ2In

Básicamente mi pregunta es: ¿cómo se estima exactamente partir de los datos para las diversas parametrizaciones? Digamos si asumimos que es diagonal (los efectos aleatorios son independientes) o completamente parametrizado (caso en el que estoy más interesado en este momento) o alguna de las otras parametrizaciones. ¿Existen estimadores / ecuaciones simples para estos? (Eso sin duda sería estimado de forma iterativa).DDD

EDITAR: Del libro Variance Components (Searle, Casella, McCulloch 2006) me las arreglé para brillar lo siguiente:

Si entonces los componentes de varianza se actualizan y calculan de la siguiente manera:D=σu2Iq

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

Donde y son las actualizaciones, respectivamente.β^(k)u^(k)k

¿Hay fórmulas generales cuando es diagonal de bloque o está completamente parametrizada? Supongo que en el caso completamente parametrizado, se utiliza una descomposición de Cholesky para garantizar una definición y simetría positivas.D

dcl
fuente
2
arxiv.org/pdf/1406.5823 (en prensa en el Journal of Statistical Software ) podría ser útil ...
Ben Bolker

Respuestas:

8

El Goldstein .pdf @probabilityislogic vinculado es un gran documento. Aquí hay una lista de algunas referencias que discuten su pregunta particular:

Harville, 1976: Extensión del teorema de Gauss-Markov para incluir la estimación de efectos aleatorios .

Harville, 1977: enfoques de máxima verosimilitud para la estimación de componentes de varianza y problemas relacionados .

Laird y Ware, 1982: modelos de efectos aleatorios para datos longitudinales .

McCulloch, 1997: algoritmos de máxima verosimilitud para modelos mixtos lineales generalizados .

La Guía de SAS User extracto para el procedimiento MIXED tiene información excelente sobre la estimación de covarianza y muchas más fuentes (a partir de la página 3968).

Existen numerosos libros de texto de calidad sobre análisis de datos de medidas longitudinales / repetidas, pero aquí hay uno que detalla algunos detalles sobre la implementación en R (de los autores de lme4ynlme ):

Pinheiro y Bates, 2000: Modelos de efectos mixtos en S y S-PLUS .

EDITAR : Un artículo más relevante: Lindstrom y Bates, 1988: Newton-Raphson y EM Algorithms para modelos lineales de efectos mixtos para datos de medidas repetidas .

EDIT 2 : Y otro: Jennrich y Schluchter, 1986: Modelos de medidas repetidas desequilibradas con matrices de covarianza estructuradas .


fuente
He echado un vistazo a Pinheiro y Bates, específicamente al Capítulo 2 (sobre teoría y computación), pero no pareció deslumbrar nada sobre cómo se aplica y estima la estructura de covarianza. Lo revisaré nuevamente en breve. Tengo algunos de esos papeles sentados aquí, definitivamente tendré que volver a leerlos. Salud.
dcl
1
@dcl Mirando hacia atrás en el Capítulo 2 de P&B, veo que pueden pasar por alto algunos de los pasos que le interesan (mencionan la optimización de la probabilidad de registro de los parámetros de covarianza, pero no dicen cómo ). Dicho esto, la Sección 2.2.8 puede ser la sección que mejor aborde su pregunta.
1
@dcl Se agregó una fuente más que puede ayudar.
gracias por los enlaces He revisado estos documentos en el pasado, algunos de ellos son bastante técnicos para mí. Voy a echar otro vistazo ahora, pero a primera vista parece que no puedo obtener lo que quiero de ellos.
dcl
1
@dcl Perdón por el muro de enlaces, pero su pregunta es una que una persona puede pasar un par de conferencias completas discutiendo (es una muy buena pregunta que se esconde debajo de la alfombra cuando aprende por primera vez sobre modelos de efectos mixtos). Además de navegar a través de la literatura, una cosa que puede hacer es mirar el código fuente lme4y ver cómo se ocupa de esta estimación.
7

Harvey Goldstein no es un mal lugar para comenzar.

Al igual que con los métodos de estimación más complejos, varía con el paquete de software. Sin embargo, a menudo lo que se hace es en los siguientes pasos:

  1. Elija un valor inicial para (digamos ) y (digamos ). EstablecerDD0RR0i=1
  2. Condicionada a y , la estimación y y . Llame a las estimaciones y yD=Di1R=Ri1βuϵβiuiϵi .
  3. Condicionado a y y , estimación y . Llame a las estimaciones yβ=βiu=uiϵ=ϵiDRDiRi
  4. Verifique la convergencia. Si no converge, establezca y regrese al paso 2i=i+1

Un método simple y rápido es IGLS, que se basa en iterar entre dos procedimientos de mínimos cuadrados, y se describe en detalle en el capítulo dos. Lo malo es que no funciona bien para componentes de varianza cercanos a cero.

probabilidadislogica
fuente
Sé que este es el método general, pero ¿cómo se estiman D y R, qué ecuaciones se utilizan para las diversas estructuras? ¿Cuáles son los buenos valores iniciales? Revisaré el pdf ahora, saludos.
dcl