Cómo escribir el término de error en medidas repetidas ANOVA en R: Error (asunto) vs Error (asunto / tiempo)

10

Mi pregunta está muy relacionada con un post anterior Especificar el término de error () en el ANOVA de medidas repetidas en I . Sin embargo, me gustaría obtener más información sobre cómo definir el término de error.

Supongamos que tengo un ANOVA repetido de dos vías. El factor para el efecto entre grupos es el Tratamiento (control versus placebo), mientras que el Tiempo es el efecto dentro del grupo medido repetidamente más de 4 veces (T1 ~ T4). La identificación del paciente se registra como Asunto. Aquí tomé prestados los datos de un ejemplo del tutorial en http://gjkerns.github.io/R/2012/01/20/power-sample-size.html para que los datos se vean así

 Time Subject Method      NDI
 0min    1     Treat 51.01078
 15min   1     Treat 47.12314
 48hrs   1     Treat 26.63542
 96hrs   1     Treat 20.78196
 0min    2     Treat 42.61345
 15min   2     Treat 32.77171

Para aplicar ANOVA:

aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1              

Error: Subject:Time        
            Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45 

También probé el otro término de error:

aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)

Error: Subject      
          Df Sum Sq Mean Sq F value Pr(>F)
Method     1    113   112.7   0.481  0.491
Residuals 58  13579   234.1               

Error: Within
             Df Sum Sq Mean Sq F value  Pr(>F)    
Time          3  13963    4654 103.789 < 2e-16 ***
Time:Method   3   1221     407   9.074 1.3e-05 ***
Residuals   174   7803      45

¿Alguien puede ayudarme a explicar las diferencias entre estos dos términos de error? Si el primer término es el correcto, ¿qué significan los resultados del segundo término de error?

Actualización de @amoeba: los dos resultados son los mismos, por lo que parece que en este caso no hay diferencia, pero la pregunta sigue siendo cuál es la diferencia en principio . ¿Son Error(subject)y Error(subject/time)siempre lo mismo?

tiantianchen
fuente
3
lo siento, me acabo de dar cuenta de que estos dos términos dan los mismos resultados. Así que supongo que son lo mismo :-)
tiantianchen
1
Esperaba una explicación para esto: /
vipin8169
Todo lo que puedo deducir sobre el término de error es esto >> "En un diseño de medidas repetidas, necesitamos especificar un término de error que tenga en cuenta la variación natural de un participante a otro. hacerlo porque me encantan las películas de zombis y las odias!) Hacemos esto con la función Error (): específicamente, estamos diciendo que queremos controlar esa variación entre participantes sobre todas nuestras variables dentro de los sujetos ".
vipin8169
(+1) Son equivalentes solo cuando hay exactamente 1 medición por cada combinación de sujeto / tiempo. Si hay más mediciones por sujeto / combinación de tiempo (ya sea simplemente porque las mediciones se repitieron, o porque hay otro sujeto dentro de factor B, además de time), entonces Error(subject)y Error(subject/time)producirá diferente F- y los valores de p para time.
ameba
La misma pregunta en SO: stackoverflow.com/questions/37497948 - desafortunadamente sin respuestas totalmente satisfactorias tampoco (en mi humilde opinión).
ameba

Respuestas:

2

Primero, la subject/timenotación para timeanidada subject, y se expande a dos partes, subjecty la subject:timeinteracción. Entonces, la pregunta es más adecuada: ¿cuándo se debe especificar la subject:timeinteracción y qué diferencia hace?

Antes de responder a esta pregunta, otra cosa importante a tener en cuenta es que todos los modelos incluyen un término de error adicional que no necesita especificarse, que es el término de error asociado con las mediciones individuales (el nivel más bajo, si lo piensa jerárquicamente).

En este caso, la subject:timeinteracción es ese nivel más bajo, que siempre se incluye en el modelo. Así que usa Error(subject)y Error(subject/time)da el mismo resultado; la única diferencia es que en la salida, ese nivel de resultados se llama Withinpara el primero y subject:timepara el segundo.

Sin embargo, en los casos en que hay múltiples mediciones en cada subject/timecombinación, es necesario especificar la subject:timeinteracción, ya que esa interacción no está en el nivel más bajo.

Aaron dejó Stack Overflow
fuente
(Tenía una recompensa abierta por esta pregunta, pero desafortunadamente se acabó ayer ...) +1, pero creo que esta respuesta evita lo que puede ser el problema central aquí: en presencia de múltiples mediciones por cada subject/timecombinación, ¿por qué necesariamente ¿Quieres probar el efecto de timerelativo a la subject:timeinteracción? Este es esencialmente el contenido de mi pregunta aquí stats.stackexchange.com/questions/286280 , por lo que invitaría a los futuros lectores de este hilo a buscar justificación conceptual.
ameba
Además, hay una Q y A muy similar aquí: stats.stackexchange.com/questions/247582 .
ameba