¿Qué significaría un intervalo de confianza alrededor de un valor predicho de un modelo de efectos mixtos?

14

Estaba mirando esta páginay noté los métodos para intervalos de confianza para lme ​​y lmer en R. Para aquellos que no conocen R, esas son funciones para generar efectos mixtos o modelos de niveles múltiples. Si tengo efectos fijos en algo así como un diseño de medidas repetidas, ¿qué significaría un intervalo de confianza alrededor del valor predicho (similar a la media)? Puedo entender que, para un efecto, puede tener un intervalo de confianza razonable, pero me parece que es imposible un intervalo de confianza alrededor de una media prevista en tales diseños. Podría ser muy grande reconocer el hecho de que la variable aleatoria contribuye a la incertidumbre en la estimación, pero en ese caso no sería útil en absoluto en un sentido inferencial al comparar valores. O,

¿Me estoy perdiendo algo aquí o mi análisis de la situación es correcto? ... [y probablemente una justificación de por qué no se implementa en lmer (pero es fácil de obtener en SAS). :)]

John
fuente
Dado que, en esencia, la anidación en un lmer lo convierte en un diseño de medidas repetidas, ¿hay alguna forma en que su pregunta sobre el intervalo de confianza apropiado alrededor del tamaño del efecto esté relacionada con la pregunta en ANOVA de medidas repetidas sobre qué medida del tamaño del efecto informar? Específicamente, no está claro si el término de error debe incluir la varianza del sujeto o no (etc.)
russellpierce
No importa: no lo pensé hasta el final.
russellpierce

Respuestas:

7

Tiene el mismo significado que cualquier otro intervalo de confianza: bajo el supuesto de que el modelo es correcto, si el experimento y el procedimiento se repiten una y otra vez, el 95% del tiempo el verdadero valor de la cantidad de interés estará dentro del intervalo. En este caso, la cantidad de interés es el valor esperado de la variable de respuesta.

Probablemente sea más fácil explicar esto en el contexto de un modelo lineal (los modelos mixtos son solo una extensión de esto, por lo que se aplican las mismas ideas):

La suposición habitual es que:

yyo=Xyo1β1+Xyo2β2+...Xyopagβpag+ϵ

donde es la respuesta, X i j son las covariables,yyoXyoj son los parámetros y ϵ es el término de error que tiene media cero. La cantidad de interés es entonces:βjϵ

mi[yyo]=Xyo1β1+Xyo2β2+...Xyopagβpag

que es una función lineal de los parámetros (desconocidos), ya que las covariables son conocidas (y fijas). Como conocemos la distribución de muestreo del vector de parámetros, podemos calcular fácilmente la distribución de muestreo (y, por lo tanto, el intervalo de confianza) de esta cantidad.

Entonces, ¿por qué quieres saberlo? Supongo que si está haciendo una predicción fuera de la muestra, podría decirle qué tan bueno se espera que sea su pronóstico (aunque deberá tener en cuenta la incertidumbre del modelo).

Simon Byrne
fuente
Ese es mi segundo escenario, el intervalo de confianza es demasiado grande para tener un valor inferencial dentro del diseño del experimento, ya que las diferencias entre las condiciones se basan en los efectos con la variabilidad entre S eliminada. Parece que siempre tiene un significado de compromiso y necesita su propio nombre especial porque no puede usarlo como un CI normal.
John
Blouin y Riopelle (2005) los llamaron intervalos de confianza de inferencia estrechos y amplios, pero dado que la población científica general fuera de las estadísticas tiene bastante tiempo con los regulares ...
John
1

(yyojEl |μyo)norte(μyo,σw2),μyonorte(μ,σsi2),
μσw2σsi2μyo95%95%
Stéphane Laurent
fuente