Estoy confundido acerca de la suposición de normalidad en medidas repetidas ANOVA. Específicamente, me pregunto qué tipo de normalidad debería satisfacerse exactamente. Al leer la literatura y las respuestas en CV, me encontré con tres palabras distintas de esta suposición.
La variable dependiente dentro de cada condición (repetida) debe distribuirse normalmente.
A menudo se dice que rANOVA tiene los mismos supuestos que ANOVA, más la esfericidad. Esa es la afirmación en las estadísticas de Field's Discovering , así como en el artículo de Wikipedia sobre el tema y el texto de Lowry .
Los residuos (diferencias entre todos los pares posibles?) Deben distribuirse normalmente.
Encontré esta afirmación en múltiples respuestas en CV ( 1 , 2 ). Por analogía de rANOVA con la prueba t emparejada , esto también puede parecer intuitivo.
La normalidad multivariada debe ser satisfecha.
Wikipedia y esta fuente mencionan esto. Además, sé que rANOVA puede intercambiarse con MANOVA, lo que podría merecer esta afirmación.
¿Son equivalentes de alguna manera? Sé que la normalidad multivariada significa que cualquier combinación lineal de los DV se distribuye normalmente, por lo que 3. naturalmente incluiría 2. si entiendo esto último correctamente.
Si no son lo mismo, ¿cuál es el supuesto "verdadero" de la rANOVA? ¿Me puede proporcionar una referencia?
Me parece que hay más apoyo para el primer reclamo. Sin embargo, esto no está en línea con las respuestas que generalmente se proporcionan aquí.
Modelos lineales mixtos
Debido a la sugerencia de @ utobi, ahora entiendo cómo se puede restablecer rANOVA como un modelo mixto lineal. Específicamente, para modelar cómo cambia la presión arterial con el tiempo, modelaría el valor esperado como: donde son las mediciones de la presión arterial, la presión media de la sangre de la sujeto-ésimo, y como el tiempo -ésimo la se midió sujeto -ésimo, denota que el cambioy i j a i i t i j j i b i
Finalmente, traté de pensar en lo que esto significa para la normalidad, pero con poco éxito. Parafraseando a McCulloch y Searle (2001, p. 35. Eq. (2.14)):
Entiendo que esto significa que
4. los datos de cada individuo deben distribuirse normalmente, pero esto no es razonable para probar con pocos puntos de tiempo.
Tomo la tercera expresión para decir que
5. los promedios de asignaturas individuales se distribuyen normalmente. Tenga en cuenta que estas son otras dos posibilidades distintas además de las tres mencionadas anteriormente.
McCulloch, CE y Searle, SR (2001). Modelos generalizados, lineales y mixtos . Nueva York: John Wiley & Sons, Inc.
Respuestas:
Este es el modelo ANOVA de medidas repetidas más simple si lo tratamos como un modelo univariante:
donde representa cada caso las veces que los medimos (por lo que los datos están en forma larga). representa los resultados apilados uno encima del otro, representa la media de cada caso, representa la media de cada punto de tiempo y representa las desviaciones de las mediciones individuales desde el caso y el punto de tiempo significa. Puede incluir factores adicionales adicionales como predictores en esta configuración.t y i t a i b t ϵ i tyo t yyo t unyo sit ϵyo t
No es necesario hacer suposiciones de distribución sobre , ya que pueden entrar en el modelo como efectos fijos, variables ficticias (al contrario de lo que hacemos con los modelos lineales mixtos). Lo mismo sucede para las muñecas de tiempo. Para este modelo, simplemente hace retroceder el resultado en forma larga contra los maniquíes de persona y los maniquíes de tiempo. El efecto de interés es el tiempo ficticio, la prueba que prueba la hipótesis nula de que es la prueba principal en el ANOVA de medidas repetidas univariadas. F b 1 = . . . = b t = 0unyo F si1= . . . = bt= 0
¿Cuáles son los supuestos requeridos para que la prueba comporte adecuadamente? El relevante para su pregunta es:F
Hay suposiciones adicionales (más consecuentes) para que la prueba sea válida, ya que se puede ver que los datos no son independientes entre sí, ya que los individuos repiten entre filas.F
Si desea tratar las medidas repetidas ANOVA como un modelo multivariado, los supuestos de normalidad pueden ser diferentes, y no puedo ampliarlos más allá de lo que usted y yo hemos visto en Wikipedia.
fuente
La explicación de la normalidad de ANOVA de medida repetida se puede encontrar aquí:
Comprender los supuestos ANOVA de medidas repetidas para la interpretación correcta de la salida de SPSS
Necesita normalidad de las variables dependientes en los residuos (esto implica una distribución normal en todos los grupos, con varianza común y promedio dependiente del grupo), como en la regresión.3 → 1 3 → 2 5 5
Como notó, la normalidad multivariada implica que todas las combinaciones lineales de las variables dependientes están normalmente distribuidas, por lo que es un concepto más fuerte que la normalidad de las variables individuales ( ). Sin embargo, no estoy convencido de que esto implique la normalidad de los residuos ( ), dado que los residuos están determinados por variables independientes (grupos, en ANOVA) también. Estoy de acuerdo con usted en el punto : básicamente está hablando de un efecto aleatorio de nivel individual que tiene una distribución normal.
fuente