Sabemos que una prueba t emparejada es solo un caso especial de ANOVA de medidas repetidas unidireccionales (o dentro del sujeto), así como el modelo lineal de efectos mixtos, que se puede demostrar con la función lme () del paquete nlme en R Como se muestra abajo.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Cuando ejecuto la siguiente prueba t emparejada:
t.test(x1, x2, paired = TRUE)
Obtuve este resultado (obtendrá un resultado diferente debido al generador aleatorio):
t = -2.3056, df = 9, p-value = 0.04657
Con el enfoque ANOVA podemos obtener el mismo resultado:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Ahora puedo obtener el mismo resultado en lme con el siguiente modelo, suponiendo una matriz de correlación simétrica definida positiva para las dos condiciones:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
U otro modelo, suponiendo una simetría compuesta para la matriz de correlación de las dos condiciones:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Con la prueba t pareada y el ANOVA de medidas repetidas unidireccionales, puedo escribir el modelo de media celular tradicional como
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
donde i indexa la condición, j indexa el sujeto, Y ij es la variable de respuesta, μ es constante para el efecto fijo para la media general, α i es el efecto fijo para la condición, β j es el efecto aleatorio para el sujeto después de N (0, σ p 2 ) (σ p 2 es la varianza de la población), y ε ij es residual después de N (0, σ 2 ) (σ 2 es la varianza dentro del sujeto).
Pensé que el modelo de media de celda anterior no sería apropiado para los modelos lme, pero el problema es que no puedo encontrar un modelo razonable para los dos enfoques lme () con el supuesto de estructura de correlación. La razón es que el modelo lme parece tener más parámetros para los componentes aleatorios que los que ofrece el modelo de media celular anterior. Al menos el modelo lme proporciona exactamente el mismo valor F, grados de libertad y valor p también, que gls no puede. Más específicamente, gls da DF incorrectos debido al hecho de que no tiene en cuenta el hecho de que cada sujeto tiene dos observaciones, lo que lleva a DF muy inflados. Lo más probable es que el modelo lme esté sobre-parametrizado al especificar los efectos aleatorios, pero no sé cuál es el modelo y cuáles son los parámetros. Entonces el problema aún no está resuelto para mí.
fuente
Respuestas:
La equivalencia de los modelos se puede observar calculando la correlación entre dos observaciones del mismo individuo, de la siguiente manera:
Sin embargo, tenga en cuenta que los modelos no son del todo equivalentes, ya que el modelo de efectos aleatorios obliga a la correlación a ser positiva. El modelo CS y el modelo t-test / anova no.
EDITAR: También hay otras dos diferencias. Primero, los modelos CS y de efectos aleatorios suponen normalidad para el efecto aleatorio, pero el modelo t-test / anova no. En segundo lugar, los modelos CS y de efectos aleatorios se ajustan utilizando la máxima probabilidad, mientras que el anova se ajusta utilizando cuadrados medios; cuando todo esté equilibrado estarán de acuerdo, pero no necesariamente en situaciones más complejas. Finalmente, desconfiaría de usar los valores de F / df / p de los diversos ajustes como medidas de cuánto coinciden los modelos; vea la famosa regla de Doug Bates en df para más detalles. (EDICIÓN FINAL)
El problema con su
R
código es que no está especificando la estructura de correlación correctamente. Debe usargls
con lacorCompSymm
estructura de correlación.Genere datos para que haya un efecto sujeto:
Entonces, así es como encajaría los efectos aleatorios y los modelos de simetría compuesta.
Los errores estándar del modelo de efectos aleatorios son:
Y la correlación y la varianza residual del modelo CS es:
Y son iguales a lo que se espera:
Otras estructuras de correlación generalmente no se ajustan a los efectos aleatorios, sino simplemente especificando la estructura deseada; Una excepción común es el modelo de efectos aleatorios AR (1) +, que tiene un efecto aleatorio y la correlación AR (1) entre observaciones sobre el mismo efecto aleatorio.
EDIT2: cuando me ajusto a las tres opciones, obtengo exactamente los mismos resultados, excepto que gls no intenta adivinar el df para el término de interés.
(La intersección es diferente aquí porque con la codificación predeterminada, no es la media de todos los sujetos, sino la media del primer sujeto).
También es interesante notar que el
lme4
paquete más nuevo da los mismos resultados pero ni siquiera trata de calcular un valor p.fuente
También puede considerar el uso de la función
mixed
en el paqueteafex
para devolver los valores de p con la aproximación df de Kenward-Roger, que devuelve valores de p idénticos como una prueba t emparejada:O
fuente