Intuición sobre la estimación de parámetros en modelos mixtos (parámetros de varianza vs. modos condicionales)

15

He leído muchas veces que los efectos aleatorios (BLUP / modos condicionales para, por ejemplo, sujetos) no son parámetros de un modelo de efectos lineales mixtos, sino que pueden derivarse de los parámetros estimados de varianza / covarianza. Por ejemplo, Reinhold Kliegl et al. (2011) estado:

Los efectos aleatorios son las desviaciones de los sujetos de la gran RT media y las desviaciones de los sujetos de los parámetros de efectos fijos. Se supone que se distribuyen de manera independiente y normalmente con una media de 0. Es importante reconocer que estos efectos aleatorios no son parámetros del LMM, solo lo son sus variaciones y covarianzas. Los parámetros [...] LMM en combinación con los datos de los sujetos se pueden usar para generar "predicciones" (modos condicionales) de efectos aleatorios para cada sujeto.

¿Puede alguien dar una explicación intuitiva de cómo se pueden estimar los parámetros de (co) varianza de los efectos aleatorios sin usar / estimar realmente los efectos aleatorios?

statmerkur
fuente

Respuestas:

6

Considere un modelo mixto lineal simple, por ejemplo, un modelo de intercepción aleatoria donde estimamos la dependencia de en x en diferentes sujetos, y supongamos que cada sujeto tiene su propia intercepción aleatoria: y = a + b x + c i + ϵ . Aquí las intersecciones c i se modelan como provenientes de una distribución gaussiana c iN ( 0 , τ 2 ) y el ruido aleatorio también es gaussiano ϵ N ( 0 , σ 2yX

y=un+siX+Cyo+ϵ.
Cyo
Cyonorte(0 0,τ2)
En lasintaxis, este modelo se escribiría como.
ϵnorte(0 0,σ2).
lme4y ~ x + (1|subject)

Es instructivo reescribir lo anterior de la siguiente manera:

yCnorte(un+siX+C,σ2)Cnorte(0 0,τ2)

Esta es una forma más formal de especificar el mismo modelo probabilístico. De esta formulación podemos ver directamente que los efectos aleatorios no son "parámetros": son variables aleatorias no observadas. Entonces, ¿cómo podemos estimar los parámetros de varianza sin conocer los valores de c ?CyoC

yCCyCyC

norte(un+siX,σ2+τ2)nortey

ynorte(un+siX,Σ)
Σ=σ2yonorte+τ2yonorte1METROσ2τ2cci

abτ2σ2cii

ameba dice Reinstate Monica
fuente
1
yN(a+bx,σ2I)
yN(a+bx,Σ)
Sextus Empiricus
ccc
Creo que simplemente no entiendo el paso de integración. Como @Martijn Weterings señaló un pequeño (código R) ejemplo o referencia donde uno puede encontrar que esto sería genial.
statmerkur
Gracias por aceptar mi respuesta y otorgarme la recompensa @statmerkur, pero es una pena que no esté claro. Trataré de pensar en un ejemplo. Te enviaré un ping cuando actualice la respuesta.
ameba dice Reinstate Monica
@statmerkur En una respuesta a esta pregunta, demuestro el cálculo manual de un modelo de efectos mixtos (manual en el sentido de escribir la función de probabilidad, la optimización aún se realiza mediante una función de optimización estándar en R) stats.stackexchange.com/a/ 337348/164061
Sextus Empiricus
0

Puede estimar fácilmente los parámetros de varianza y covarianza sin depender de efectos aleatorios mediante el uso de efectos fijos (vea aquí una discusión sobre los efectos fijos frente a los efectos aleatorios; tenga en cuenta el hecho de que existen diferentes definiciones de estos términos).

Los efectos fijos se pueden derivar fácilmente agregando una variable indicadora (binaria) para cada grupo (o cada período de tiempo o lo que esté pensando usar como efectos aleatorios; esto es equivalente a la transformación interna). Esto le permite estimar fácilmente los efectos fijos (que se pueden ver como un parámetro).

La suposición de efectos fijos no requiere que asuma la distribución de los efectos fijos, puede estimar fácilmente la varianza de los efectos fijos (aunque esto es extremadamente ruidoso si el número de observaciones dentro de cada grupo es pequeño; minimizan el sesgo por el gasto de una varianza mucho mayor en comparación con los efectos aleatorios porque pierde un grado de libertad para cada grupo al agregar estas variables indicadoras). También puede estimar covarianzas entre diferentes conjuntos de efectos fijos, o entre efectos fijos y otras covariables. Lo hemos hecho, por ejemplo, en un artículo llamado Equilibrio competitivo y emparejamiento surtido en la Bundesliga alemana para estimar si los mejores jugadores de fútbol juegan cada vez más para mejores equipos.

Los efectos aleatorios necesitan una suposición previa sobre la covarianza. En los modelos clásicos de efectos aleatorios, se supone que los efectos aleatorios son como un error y que son independientes de las otras covariables (de modo que puede ignorarlos y utilizar OLS y obtener estimaciones coherentes aunque ineficientes para el otro parámetro si los supuestos del modelo de efectos aleatorios son ciertos).

Más información más técnica está disponible aquí . Andrew Gelman también tiene mucho trabajo más intuitivo sobre esto en su buen libro Análisis de datos usando regresión y modelos multinivel / jerárquicos

Arne Jonas Warnke
fuente
1
Me refiero a los parámetros de (co) varianza de los efectos aleatorios (ver mi edición).
statmerkur
2
No creo que esto responda la pregunta.
ameba dice Reinstate Monica