Comprender el efecto de un factor aleatorio continuo en un modelo de efectos mixtos

Entiendo el efecto de un efecto aleatorio categórico en un modelo de efectos mixtos en el sentido de que realiza una agrupación parcial de las observaciones por nivel en el efecto aleatorio, suponiendo efectivamente que las observaciones no son independientes en sí mismas, sino solo sus agrupaciones parciales. También a mi entender, en un modelo de este tipo, las observaciones que comparten el mismo nivel de efecto aleatorio pero que difieren en su nivel de efecto fijo superarán las observaciones que difieren tanto en su efecto aleatorio como en sus niveles de efecto fijo.

¿Cuál es el efecto de un factor aleatorio continuo entonces? Dado que un modelo sin el efecto aleatorio mostró que el efecto fijo tenía un tamaño de efecto X. ¿Debería esperar que si las observaciones en los diferentes niveles del efecto fijo provengan de extremos lejanos del continuo del efecto aleatorio, el tamaño del efecto se reducirá en un modelo que incluía el factor aleatorio, mientras que si las observaciones en diferentes niveles de factores fijos tuvieran valores de efectos aleatorios similares, ¿aumentaría el tamaño del efecto?

mixed-model random-effects-model Ángel roey
fuente

¿Puede proporcionar las fórmulas y / o el código R / Stata para ejemplificar su pensamiento? Estás usando un lenguaje algo inusual ... al menos inusual para mí. Creo que su "factor aleatorio continuo" es lo que yo llamaría "pendiente aleatoria", pero primero quería comprobarlo.

StasK

@StasK En términos de R: si el factor aleatorio es categórico (factor en R), entonces las observaciones se agrupan parcialmente, es decir, las medias grupales (niveles de factores aleatorios) son promedios ponderados de la media de la población y las medias grupales no agrupadas con pesos proporcionales al tamaño de la muestra y al inverso de la varianza. Mi pregunta es, ¿qué se está haciendo cuando el factor aleatorio es continuo (numérico en términos de R)? ¿Cómo afecta eso al modelo?

Roey Angel

@RoeyAngel: probablemente no lo afecte de manera sensata. Específicamente para R's, lmerpor ejemplo, un modelo en el que el efecto aleatorio tiene un valor distinto para cada punto de datos no podrá incluso calcular. Piénselo en términos puramente conceptuales: si su matriz es cuadrada, entonces su vector que contiene la realización de efectos aleatorios será de tamaño ( : # de puntos de muestra) y, por lo tanto, tendrá una estructura de error no identificable. ¿Estás seguro de que estás preguntando esto? Como StasK, también me resulta un poco difícil seguir tu pregunta.

Z

$Z$

γ

$\gamma$

N

$N$

N

$N$

usεr11852

@ user11852 hmmm Sinceramente, nunca lo intenté con un efecto aleatorio donde cada punto tiene un valor único. Entonces, lo que básicamente está diciendo es que un efecto aleatorio siempre se trata como un factor categórico (es decir, no hay paralelo a cómo se tratan los vars continuos en un ANCOVA, por ejemplo).

Roey Angel

@RoeyAngle: No sé sobre ANCOVA específicamente, pero ciertamente lo que dije sobre los soportes de no identificabilidad. No puede estimar si es igual al tamaño de sus datos. Se ha tratado tan categóricamente como refleja una estructura (es decir, categorización) de los datos mismos (por ejemplo, lote, grupo, ubicación, etc.). Piénselo en el contexto de modelos jerárquicos (un subconjunto de modelos mixtos): si una jerarquía definiera en algún nivel tantos descendientes como puntos de datos, sería redundante.

γ

$\gamma$

γ

$\gamma$

Z

$Z$

usεr11852

Respuestas:

Tuve que pensar mucho sobre lo que estabas preguntando. Al principio pensé en la línea de @ user11852, que querías que cada observación tuviera su propio efecto aleatorio único. Eso haría que el modelo no se identificara irremediablemente, ya que no habría una forma concebible de distinguir la variación del efecto aleatorio del error del modelo.

Pero creo que en el alcance de su pregunta prevista, todos los efectos aleatorios son en realidad continuos, y probablemente normalmente distribuidos. Sin embargo, su alusión a "categórico" no está descabellada, porque la matriz de diseño para una intercepción aleatoria (típicamente llamada Z) se vería como una matriz de diseño para una variable categórica.

Agreguemos un poco de concreción y digamos que el predictor lineal es donde y son los efectos fijos y y son los efectos aleatorios específicos de . Creo que por "continuo", quiere decir un efecto aleatorio como lugar de . Tenga en cuenta que ambos son todavía constantes dentro de un tema .

(\bar{α} + α_{i}) + (\bar{β} + β_{i}) x_{i j},

$(\bar{\alpha} + \alpha_i) + (\bar{\beta} + \beta_i) x_{ij},$

\bar{α}

$\bar{\alpha}$

\bar{β}

$\bar{\beta}$

α_{i}

$\alpha_i$

β_{i}

$\beta_i$

i

$i$

β_{i}

$\beta_i$

α_{i}

$\alpha_i$

i

$i$

Ahora pensemos en su situación propuesta:

diferentes niveles del efecto fijo provenían de extremos lejanos del continuo de efectos aleatorios

Si consideramos que es el efecto fijo, entonces no podría tener diferentes niveles, pero . Supongamos que para valores pequeños de , la pendiente es menor; es negativo para los sujetos con valores principalmente pequeños de . Ahora, por construcción, los extremos de corresponden a los extremos en . $\bar{\beta}$ $x_{ij}$ $x_{ij}$ $\beta_i$ $i$ $x_{ij}$ $x_{ij}$ $\beta_i$

Eso nos deja con lo que sucede con vs sin el efecto aleatorio. Mis pensamientos son, si solo hubiera unos pocos casos extremos de la situación anterior, agregar un efecto aleatorio tendería a elevar la estimación de . Pero no estoy totalmente seguro. En el modelado mixto lineal tradicional, las estimaciones de los efectos fijos son realmente solo estimaciones de mínimos cuadrados ponderados. Si bien esos pesos están directamente relacionados con la distribución de efectos aleatorios, su impacto disminuirá a medida que aumente el tamaño de la muestra. En un entorno realista con tamaños de muestra incluso moderados, no esperaría que ocurriera nada demasiado extremo en sus estimaciones de efectos fijos cuando agrega un efecto aleatorio. $\beta$

Ben Ogorek
fuente