La pregunta de CV
Estoy tratando de dar (a) representaciones matemáticas detalladas y concisas de un modelo de efectos mixtos. Estoy usando el lme4
paquete en R. ¿Cuál es la representación matemática correcta para mi modelo?
Los datos, la pregunta científica y el código R
Mi conjunto de datos consta de especies en diferentes regiones. Estoy probando si la prevalencia de una especie cambia en el tiempo que lleva a una extinción (las extinciones no son necesariamente permanentes; puede recolonizarse), o después de una colonización.
lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))
- La prevalencia es la proporción de estratos ocupados por una especie en una región año
- El tiempo es una variable continua que indica el tiempo de extinción o colonización; siempre es positivo
- El tipo es una variable categórica con dos niveles. Estos dos niveles son "-" y "+". Cuando type es -, es una colonización (nivel predeterminado). Cuando el tipo es +, es una extinción.
- Reg es una variable categórica con nueve niveles, que indica la región
- Spp es una variable categórica; El número de niveles varía según las regiones, y varía entre 48 niveles y 144 niveles.
En palabras: la variable de respuesta es la prevalencia (proporción de estratos ocupados). Los efectos fijos incluyeron 1) e intercepción, 2) tiempo desde el evento y 3) la interacción entre el tiempo hasta el evento y el tipo de evento (colonización o extinción). Cada uno de estos 3 efectos fijos varía aleatoriamente entre las regiones. Dentro de una región, cada uno de los efectos varía aleatoriamente entre especies.
Estoy tratando de descubrir cómo escribir la ecuación matemática para el modelo. Creo que entiendo lo que está sucediendo en el código R (aunque estoy seguro de que tengo algunos vacíos de conocimiento, y espero que escribir la expresión matemática formal mejore mi comprensión).
He buscado bastante en la web y en estos foros. Encontré toneladas de información útil, para estar seguro (y tal vez vincularé a algunos de estos en una edición de esta pregunta). Sin embargo, no pude encontrar esa "Piedra de Rosetta" del código R traducida a las matemáticas (estoy más cómodo con el código) que realmente me ayudaría a confirmar que tengo estas ecuaciones correctas. De hecho, sé que ya hay algunas lagunas, pero llegaremos a eso.
Mi intento
La forma básica de un modelo de efectos mixtos, en notación matricial es (a mi entender):
β
- Δ t Δ t + es la matriz de diseño para los efectos fijos, es el tiempo después de la colonización ( ) y es el tiempo después de la extinción ( )
time
time:type
- es la matriz de diseño para los efectos aleatorios (nivel 1?), I () es la función del indicador que da 1 si la muestra pertenece a la región designada y 0 de lo contrario, r se indexa para indicar una de las nueve regiones.
- γ y contienen parámetros
- Σ es errores; No estoy completamente seguro de cómo explicar , aunque me doy cuenta de que una de estas matrices de varianza / covarianza expresará covarianzas entre pendientes e intersecciones, por ejemplo
Asumiendo que las cosas hasta ahora son ~ correctas, eso significa que soy bueno en el nivel superior. Sin embargo, explicar la variación específica de la especie en los parámetros, que está anidado dentro de cada región, me dejó perplejo aún más.
Pero tomé una grieta en algo que tal vez tenga sentido ...
Cada uno de los parámetros en se deriva de una combinación lineal de predictores y parámetros específicos de la especie dentro de una región. Para cada región, hay 3 filas de, correspondientes a las 3 variables predictoras. Cada se puede expresar individualmente comoγ
-
- donde es una matriz de diseño específica para la región y el predictor , es una matriz de parámetros 1 por S para la región (riqueza en la región = , por ejemplo, 48 o 144), y es una matriz de términos de error
Específicamente, para una región determinada, cada uno de los sería:
Eso se repetiría para cada región. Luego, , como . Aunque, quizás en lugar de , hay otra letra, como , que se usa comúnmente.
Editar: otras preguntas y respuestas que fueron algo útiles
Respuestas:
Si entendí el código correctamente, ¿por qué no simplemente escribir algo como
fuente