En un modelo multinivel, ¿cuáles son las implicaciones prácticas y relacionadas con la interpretación de estimar los parámetros de correlación de efectos aleatorios versus no estimar? La razón práctica para preguntar esto es que en el marco de Imer en R, no hay un método implementado para estimar los valores de p mediante técnicas MCMC cuando las estimaciones se realizan en el modelo de las correlaciones entre parámetros.
Por ejemplo, mirando este ejemplo (porciones citadas a continuación), ¿cuáles son las implicaciones prácticas de M2 versus M3? Obviamente, en un caso P5 no se estimará y en el otro sí.
Preguntas
- Por razones prácticas (el deseo de obtener un valor p a través de las técnicas MCMC), uno podría querer ajustar un modelo sin correlaciones entre los efectos aleatorios, incluso si P5 es sustancialmente distinto de cero. Si uno hace esto, y luego estima los valores p a través de la técnica MCMC, ¿son los resultados interpretables? (Sé que @Ben Bolker ha mencionado anteriormente que "combinar pruebas de significación con MCMC es un poco incoherente, estadísticamente, aunque entiendo la necesidad de hacerlo (obtener intervalos de confianza es más compatible)" , así que si te hará dormir mejor por la noche finjo que dije intervalos de confianza.)
- Si uno no puede estimar P5, ¿es lo mismo que afirmar que es 0?
- Si P5 realmente no es cero, ¿de qué manera se ven afectados los valores estimados de P1-P4?
- Si P5 realmente no es cero, ¿de qué manera se ven afectadas las estimaciones de error para P1-P4?
- Si P5 realmente no es cero, ¿de qué manera las interpretaciones de un modelo que no incluye P5 son defectuosas?
Tomando prestado de la respuesta de @Mike Lawrence (los que tienen más conocimiento que yo son libres de reemplazar esto con la notación de modelo completo, no estoy completamente seguro de poder hacerlo con una fidelidad razonable):
M2: V1 ~ (1|V2) + V3 + (0+V3|V2)
(Estimaciones P1 - P4)
M3: V1 ~ (1+V3|V2) + V3
(Estimaciones P1-P5)
Parámetros que pueden estimarse:
P1 : una intercepción global
P2 : intercepciones de efecto aleatorio para V2 (es decir, para cada nivel de V2, la desviación de la intercepción de ese nivel de la intercepción global)
P3 : una estimación global única para el efecto (pendiente) de V3
P4 : El efecto de V3 dentro de cada nivel de V2 (más específicamente, el grado en que el efecto V3 dentro de un nivel dado se desvía del efecto global de V3), al tiempo que impone una correlación cero entre las desviaciones de intercepción y las desviaciones del efecto V3 entre niveles de V2.
P5 : La correlación entre las desviaciones de intercepción y las desviaciones de V3 entre los niveles de V2
Serían aceptables las respuestas derivadas de una simulación suficientemente grande y amplia junto con el código adjunto en R usando lmer.
fuente
Respuestas:
Considere los datos del estudio del sueño, incluidos en lme4. Bates analiza esto en su libro en línea sobre lme4. En el capítulo 3, considera dos modelos para los datos.
y
En el estudio participaron 18 sujetos, estudiados durante un período de 10 días privados de sueño. Los tiempos de reacción se calcularon al inicio y en los días posteriores. Existe un claro efecto entre el tiempo de reacción y la duración de la privación del sueño. También hay diferencias significativas entre los sujetos. El modelo A permite la posibilidad de una interacción entre la intercepción aleatoria y los efectos de la pendiente: imagine, por ejemplo, que las personas con tiempos de reacción pobres sufren de manera más aguda los efectos de la privación del sueño. Esto implicaría una correlación positiva en los efectos aleatorios.
En el ejemplo de Bates, no hubo una correlación aparente del gráfico Lattice y no hubo diferencias significativas entre los modelos. Sin embargo, para investigar la pregunta planteada anteriormente, decidí tomar los valores ajustados del estudio del sueño, aumentar la correlación y observar el rendimiento de los dos modelos.
Como puede ver en la imagen, los largos tiempos de reacción están asociados con una mayor pérdida de rendimiento. La correlación utilizada para la simulación fue 0.58
Simulé 1000 muestras, usando el método de simulación en lme4, basado en los valores ajustados de mis datos artificiales. Encajé a M0 y Ma en cada uno y miré los resultados. El conjunto de datos original tenía 180 observaciones (10 para cada uno de los 18 sujetos), y los datos simulados tienen la misma estructura.
La conclusión es que hay muy poca diferencia.
Entonces, ¿por qué pasa ésto? @gung supuso, razonablemente, que no incluir la posibilidad de una correlación obliga a que los efectos aleatorios no estén correlacionados. Quizás debería; pero en esta implementación, los efectos aleatorios pueden correlacionarse, lo que significa que los datos pueden llevar los parámetros en la dirección correcta, independientemente del modelo. La incorrección del modelo incorrecto se muestra en la probabilidad, por lo que puede (a veces) distinguir los dos modelos en ese nivel. El modelo de efectos mixtos básicamente ajusta regresiones lineales a cada sujeto, influenciado por lo que el modelo cree que deberían ser. El modelo incorrecto fuerza el ajuste de valores menos plausibles de los que obtiene con el modelo correcto. Pero los parámetros, al final del día, se rigen por el ajuste a los datos reales.
Aquí está mi código algo torpe. La idea era ajustar los datos del estudio del sueño y luego construir un conjunto de datos simulados con los mismos parámetros, pero una correlación mayor para los efectos aleatorios. Ese conjunto de datos se alimentó para simular.lmer () para simular 1000 muestras, cada una de las cuales se ajustó en ambos sentidos. Una vez que emparejé los objetos ajustados, pude extraer diferentes características del ajuste y compararlos, usando pruebas t, o lo que sea.
fuente
Placidia ya ha proporcionado una respuesta exhaustiva utilizando datos simulados basados en el
sleepstudy
conjunto de datos. Aquí hay otra respuesta (menos rigurosa) que también usa lossleepstudy
datos.Vemos que uno puede afectar la correlación estimada entre la intersección aleatoria y la pendiente aleatoria al "desplazar" la variable predictora aleatoria. Mira los resultados de los modelos
fm1
yfm2
abajo:A partir del resultado del modelo, vemos que la correlación de varianza aleatoria ha cambiado. Sin embargo, las pendientes (fijas y aleatorias) se mantuvieron igual, al igual que la estimación de la varianza residual. Las estimaciones de intersecciones (fijas y aleatorias) cambiaron en respuesta a la variable desplazada.
La covarianza de la pendiente de intercepción aleatoria descorrelacionada para LMM se analiza en las notas de clase del Dr. Jack Weiss aquí . Weiss señala que reducir la correlación de varianza de esta manera a veces puede ayudar con la convergencia del modelo, entre otras cosas.
El ejemplo anterior varía la correlación aleatoria (parámetro "P5"). Dirigiendo parcialmente el Q3 del OP, vemos en el resultado anterior que:
fuente