¿Por qué las medidas repetidas ANOVA asumen esfericidad?

10

¿Por qué las medidas repetidas ANOVA asumen esfericidad?

Por esfericidad me refiero a la suposición de que la varianza de todas las diferencias por pares entre grupos debería ser la misma.

En particular, no entiendo por qué esto debería ser la suposición y no que las variaciones de los puntajes de los grupos observados sean las mismas.

user1205901 - Restablecer Monica
fuente
1
Como he comentado aquí , debido a que las variables de diferencia entre los niveles de RM están vinculadas, por su origen, la esfericidad implica que tienen las mismas variaciones.
ttnphns
1
Antes de responder, sería útil saber si comprende por qué las medidas independientes ANOVA tienen un supuesto de homogeneidad de varianza.
Juan
@John Entiendo que esta es la respuesta dada en stats.stackexchange.com/questions/81914/… responde correctamente esa pregunta.
user1205901 - Reinstale a Monica
@ttnphns Lamentablemente, no entiendo bien tu respuesta. ¿Le interesaría usted o algún otro póster dar una respuesta más detallada?
user1205901 - Reinstale a Monica

Respuestas:

2

Intuición detrás del supuesto de esfericidad

Uno de los supuestos de las medidas comunes, no repetidas, ANOVA es la varianza igual en todos los grupos.

(Podemos entenderlo porque se necesita la misma varianza, también conocida como homocedasticidad , para que el estimador de MCO en regresión lineal sea AZUL y para que las pruebas t correspondientes sean válidas, vea el teorema de Gauss-Markov . Y ANOVA puede implementarse como lineal regresión.)

Así que tratemos de reducir el caso RM-ANOVA al caso no RM. Para simplificar, trataré con RM-ANOVA de un factor (sin efectos entre sujetos) que tenga sujetos grabados en k condiciones RM.nk

Cada sujeto puede tener su propio desplazamiento o intercepción específica del sujeto. Si restamos valores en un grupo de los valores en todos los demás grupos, cancelaremos estas intercepciones y llegaremos a la situación en la que podemos usar un ANOVA que no sea RM para probar si estas diferencias de grupo son todas cero. Para que esta prueba sea válida, necesitamos un supuesto de varianzas iguales de estas diferencias k - 1 .k1k1

Ahora podemos restar el grupo # 2 de todos los demás grupos, llegando nuevamente a diferencias que también deberían tener variaciones iguales. Para cada grupo de k , las varianzas de las diferencias k - 1 correspondientes deben ser iguales. Sigue rápidamente que todas las diferencias posibles k ( k - 1 ) / 2 deben ser iguales.k-1kk-1k(k-1)/ /2

Que es precisamente el supuesto de esfericidad.

¿Por qué no deberían ser iguales las variaciones de grupo?

Cuando pensamos en RM-ANOVA, generalmente pensamos en un modelo aditivo simple de estilo de modelo mixto de la forma donde α i son efectos sujetos, β j son efectos de condición, y ϵ N ( 0 , σ 2 ) .

yyoj=μ+αyo+βj+ϵyoj,
αyoβjϵnorte(0 0,σ2)

Para este modelo, las diferencias de grupo seguirán a , es decir, todas tendrán la misma varianza 2 σ 2 , por lo que se mantiene la esfericidad. Pero cada grupo seguirá una mezcla de n gaussianos con medias en α i y varianzas σ 2 , que es una distribución complicada con varianza V ( α , σ 2 ) que es constante entre los grupos.norte(βj1-βj2,2σ2)2σ2norteαyoσ2V(α,σ2)

Entonces, en este modelo, de hecho, las variaciones de grupo también son las mismas. Las covarianzas grupales también son las mismas, lo que significa que este modelo implica simetría compuesta . Esta es una condición más estricta en comparación con la esfericidad. Como muestra mi argumento intuitivo anterior, RM-ANOVA puede funcionar bien en la situación más general, cuando el modelo aditivo escrito anteriormente no se cumple .

Enunciado matemático preciso

Agregaré aquí algo de Huynh & Feldt, 1970, Condiciones bajo las cuales las razones cuadradas medias en diseños de mediciones repetidas tienen distribuciones exactasF .

¿Qué sucede cuando se rompe la esfericidad?

Cuando la esfericidad no se mantiene, probablemente podamos esperar que RM-ANOVA (i) tenga un tamaño inflado (más errores tipo I), (ii) tenga una potencia disminuida (más errores tipo II). Uno puede explorar esto mediante simulaciones, pero no voy a hacerlo aquí.

ameba
fuente
4

Resulta que el efecto de violar la esfericidad es una pérdida de potencia (es decir, una mayor probabilidad de un error de Tipo II) y una estadística de prueba (relación F) que simplemente no se puede comparar con los valores tabulados de la distribución F. La prueba F se vuelve demasiado liberal (es decir, la proporción de rechazos de la hipótesis nula es mayor que el nivel alfa cuando la hipótesis nula es verdadera.

La investigación precisa de este tema es muy complicada, pero afortunadamente Box et al escribieron un artículo sobre eso: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

υ1=UNA-1υ2=(UNA-1)(S-1)

υ1ϵ

υ1=ϵ(UNA-1)
υ2=ϵ(UNA-1)(S-1)

ξuna,una

ϵ=(unaξuna,una)2(UNA-1)una,unaξuna,una2

El índice Box de esfericidad se entiende mejor en relación con los valores propios de una matriz de covarianza. Recuerde que las matrices de covarianza pertenecen a la clase de matrices semi-definidas positivas y, por lo tanto, siempre tienen valores propios nulos positivos. Por lo tanto, la condición de esfericidad es equivalente a tener todos los valores propios iguales a una constante.

Entonces, cuando se viola la esfericidad, debemos aplicar alguna corrección para nuestras estadísticas F, y los ejemplos más notables de estas correcciones son Greenhouse-Geisser y Huynh-Feldt, por ejemplo

Sin ninguna corrección, sus resultados serán parciales y poco confiables. ¡Espero que esto ayude!

Vasto académico
fuente
+1. Más adelante comentaré más, pero por ahora su primer párrafo mezcla la potencia y el tamaño de la prueba. ¿Qué se deteriora cuando se viola la esfericidad? ¿La tasa de error tipo I bajo nulo? O el poder? ¿O ambos? Probablemente te refieres a ambos, pero la formulación no es muy clara (creo). Además, no es "Box et al", es Box solo :)
ameba
Creo que el poder se verá afectado principalmente porque, como mostró Box, cuando se viola la esfericidad tenemos que confiar en estadísticas completamente diferentes (con otros grados de libertad). Si no confiamos en eso, entonces, dependiendo de cuán fuerte sea nuestra violación, tendremos una mayor proporción de rechazos de la hipótesis nula.
Gran académico
Lo siento, todavía confundido, ahora por su comentario: "mayor proporción de rechazos de lo nulo", ¿quiere decir cuando lo nulo es realmente cierto? Pero esto no tiene nada que ver con el poder, esta es la tasa de error tipo I.
ameba
+10. Le doy mi recompensa a esta respuesta: es buena y también es la única respuesta que apareció en el período de recompensa. No estoy completamente satisfecho con su respuesta (¿todavía?) Y comencé a escribir mi propia respuesta (actualmente incompleta, pero ya publicada), pero solo tengo una comprensión parcial de las matemáticas subyacentes. Su respuesta definitivamente ayudó y la referencia a Box 1954 también es muy útil.
ameba
ϵϵξUNA×UNA
1

yyojkyo=1,...,yo;j=1,...,J;k=1,...,K.

La media muestral del grupo i-ésimo es

y¯yo..=1JKj=1Jk=1Kyyojk

y el del sujeto i-ésimo es

y¯yoj.=1Kk=1Kyyojk

Al asumir la independencia entre los sujetos, la varianza de la diferencia entre dos medias grupales es

Vunar(y¯yo..-y¯yo..)=1J2j=1JVunar(y¯yoj.)+1J2j=1JVunar(y¯yoj.)

Vunar(y¯yoj.)σ2/ /Kσ2Vunar(y¯yoj.)

Ahora, a la pregunta de esfericidad que se planteó.

y¯..k-y¯..k

y¯..k=1yoJyo=1yoj=1Jyyojk.
yyojkyyojk

Vunar(y¯..k-y¯..k)=1(yoJ)2yo=1yoj=1JVunar(yyojk-yyojk)

Por lo tanto, suponiendo una varianza constante de todas las diferencias por pares, es válido realizar una prueba t una vez que se estima la varianza común. Esta suposición, junto con la varianza constante de cada observación, implica que la covarianza entre cualquier par de mediciones es constante en todos los pares: SergioTiene una gran publicación sobre este tema. Por lo tanto, los supuestos generan una estructura de varianza-covarianza para mediciones repetidas de cada sujeto como una matriz con una constante en diagonal y otra constante fuera de la diagonal. Cuando las entradas fuera de la diagonal son todas cero, se reduce al modelo totalmente independiente (que podría ser inapropiado para muchos estudios de medición repetidos). Cuando las entradas fuera de la diagonal son las mismas que la diagonal, las mediciones repetidas están perfectamente correlacionadas para un sujeto, lo que significa que cualquier medición individual es tan buena como todas las mediciones para cada sujeto. Nota final: cuando K = 2 en nuestro diseño de parcela dividida simple, la condición de esfericidad se cumple automáticamente.

T Lin
fuente