Mi pregunta está muy relacionada con un post anterior Especificar el término de error () en el ANOVA de medidas repetidas en I . Sin embargo, me gustaría obtener más información sobre cómo definir el término de error.
Supongamos que tengo un ANOVA repetido de dos vías. El factor para el efecto entre grupos es el Tratamiento (control versus placebo), mientras que el Tiempo es el efecto dentro del grupo medido repetidamente más de 4 veces (T1 ~ T4). La identificación del paciente se registra como Asunto. Aquí tomé prestados los datos de un ejemplo del tutorial en http://gjkerns.github.io/R/2012/01/20/power-sample-size.html para que los datos se vean así
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
Para aplicar ANOVA:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
También probé el otro término de error:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
¿Alguien puede ayudarme a explicar las diferencias entre estos dos términos de error? Si el primer término es el correcto, ¿qué significan los resultados del segundo término de error?
Actualización de @amoeba: los dos resultados son los mismos, por lo que parece que en este caso no hay diferencia, pero la pregunta sigue siendo cuál es la diferencia en principio . ¿Son Error(subject)
y Error(subject/time)
siempre lo mismo?
fuente
time
), entoncesError(subject)
yError(subject/time)
producirá diferente F- y los valores de p paratime
.Respuestas:
Primero, la
subject/time
notación paratime
anidadasubject
, y se expande a dos partes,subject
y lasubject:time
interacción. Entonces, la pregunta es más adecuada: ¿cuándo se debe especificar lasubject:time
interacción y qué diferencia hace?Antes de responder a esta pregunta, otra cosa importante a tener en cuenta es que todos los modelos incluyen un término de error adicional que no necesita especificarse, que es el término de error asociado con las mediciones individuales (el nivel más bajo, si lo piensa jerárquicamente).
En este caso, la
subject:time
interacción es ese nivel más bajo, que siempre se incluye en el modelo. Así que usaError(subject)
yError(subject/time)
da el mismo resultado; la única diferencia es que en la salida, ese nivel de resultados se llamaWithin
para el primero ysubject:time
para el segundo.Sin embargo, en los casos en que hay múltiples mediciones en cada
subject/time
combinación, es necesario especificar lasubject:time
interacción, ya que esa interacción no está en el nivel más bajo.fuente
subject/time
combinación, ¿por qué necesariamente ¿Quieres probar el efecto detime
relativo a lasubject:time
interacción? Este es esencialmente el contenido de mi pregunta aquí stats.stackexchange.com/questions/286280 , por lo que invitaría a los futuros lectores de este hilo a buscar justificación conceptual.