Básicamente, me pregunto cómo se aplican las diferentes estructuras de covarianza y cómo se calculan los valores dentro de estas matrices. Funciones como lme () nos permiten elegir qué estructura nos gustaría, pero me encantaría saber cómo se estiman.
Considere el modelo de efectos lineales mixtos .
Donde y . Además:
Por simplicidad asumiremos .
Básicamente mi pregunta es: ¿cómo se estima exactamente partir de los datos para las diversas parametrizaciones? Digamos si asumimos que es diagonal (los efectos aleatorios son independientes) o completamente parametrizado (caso en el que estoy más interesado en este momento) o alguna de las otras parametrizaciones. ¿Existen estimadores / ecuaciones simples para estos? (Eso sin duda sería estimado de forma iterativa).
EDITAR: Del libro Variance Components (Searle, Casella, McCulloch 2006) me las arreglé para brillar lo siguiente:
Si entonces los componentes de varianza se actualizan y calculan de la siguiente manera:
Donde y son las actualizaciones, respectivamente.
¿Hay fórmulas generales cuando es diagonal de bloque o está completamente parametrizada? Supongo que en el caso completamente parametrizado, se utiliza una descomposición de Cholesky para garantizar una definición y simetría positivas.
Respuestas:
El Goldstein .pdf @probabilityislogic vinculado es un gran documento. Aquí hay una lista de algunas referencias que discuten su pregunta particular:
Harville, 1976: Extensión del teorema de Gauss-Markov para incluir la estimación de efectos aleatorios .
Harville, 1977: enfoques de máxima verosimilitud para la estimación de componentes de varianza y problemas relacionados .
Laird y Ware, 1982: modelos de efectos aleatorios para datos longitudinales .
McCulloch, 1997: algoritmos de máxima verosimilitud para modelos mixtos lineales generalizados .
La Guía de SAS User extracto para el procedimiento MIXED tiene información excelente sobre la estimación de covarianza y muchas más fuentes (a partir de la página 3968).
Existen numerosos libros de texto de calidad sobre análisis de datos de medidas longitudinales / repetidas, pero aquí hay uno que detalla algunos detalles sobre la implementación en R (de los autores de
lme4
ynlme
):Pinheiro y Bates, 2000: Modelos de efectos mixtos en S y S-PLUS .
EDITAR : Un artículo más relevante: Lindstrom y Bates, 1988: Newton-Raphson y EM Algorithms para modelos lineales de efectos mixtos para datos de medidas repetidas .
EDIT 2 : Y otro: Jennrich y Schluchter, 1986: Modelos de medidas repetidas desequilibradas con matrices de covarianza estructuradas .
fuente
lme4
y ver cómo se ocupa de esta estimación.Harvey Goldstein no es un mal lugar para comenzar.
Al igual que con los métodos de estimación más complejos, varía con el paquete de software. Sin embargo, a menudo lo que se hace es en los siguientes pasos:
Un método simple y rápido es IGLS, que se basa en iterar entre dos procedimientos de mínimos cuadrados, y se describe en detalle en el capítulo dos. Lo malo es que no funciona bien para componentes de varianza cercanos a cero.
fuente
El siguiente artículo ofrece una solución de forma cerrada para D:
fuente
dos referencias más que podrían ser útiles Componentes de varianza de Searle et al y Lynch y Walsh Genetics and Analysis of Quantitative Traits . El libro de Lynch y Walsh ofrece un algoritmo paso a paso si recuerdo bien
fuente