¿Cuál es la hipótesis NULL para la interacción en un ANOVA de dos vías?

20

Digamos que tenemos dos factores (A y B), cada uno con dos niveles (A1, A2 y B1, B2) y una variable de respuesta (y).

Al realizar un ANOVA de dos vías del tipo:

y~A+B+A*B

Estamos probando tres hipótesis nulas:

  1. No hay diferencia en las medias del factor A
  2. No hay diferencia en las medias del factor B
  3. No hay interacción entre los factores A y B

Cuando está escrito, las dos primeras hipótesis son fáciles de formular (para 1 es H0:μA1=μA2 )

Pero, ¿cómo debe formularse la hipótesis 3?

editar : ¿y cómo se formularía para el caso de más de dos niveles?

Gracias.

Tal Galili
fuente
3
No tengo la reputación de permitirme editar, pero creo que quieres (o μ A 1 si quieres un doble subíndice) [¡Vaya! : o ]H0=μA1=μA2μA1H_0 = \mu_{A1}=\mu_{A2}\mu_{A_1}
Ben Bolker
1
Oups, no vi que estás usando letras mayúsculas para denotar el nombre del factor y sus niveles; arréglalo (siguiendo la notación @Ben).
chl

Respuestas:

18

Creo que es importante separar claramente la hipótesis y su prueba correspondiente. Para lo siguiente, supongo un diseño equilibrado entre sujetos CRF- (tamaños de celda iguales, notación de Kirk: diseño factorial completamente aleatorio).pq

es la observación i en el tratamiento j del factor A y el tratamiento k del factor B con 1 i n , 1 j p y 1 k q . El modelo es Y i j k = μ j k + ϵ i ( j k ) ,YijkijAkB1in1jp1kqYijk=μjk+ϵi(jk),ϵi(jk)N(0,σϵ2)

Diseño: B 1 ... B k ... B q A 1 μ 11 ... μ 1 k ... μ 1 q μ 1. ... ... ... ... ... ... ... A j μ j 1 ... μ j k ... μ j q μ j . ... ... ... ... ... ... ... A p μ p 1 ... μ B1BkBq A1μ11μ1kμ1qμ1.Ajμj1μjkμjqμj.Apμp1μpkμpqμp. μ.1μ.kμ.qμ

es el valor esperado en la celda j k , ϵ i ( j k ) es el error asociado con la medición de la persona i en esa celda. Lanotación ( ) indica que los índices j k son fijos para cualquier persona i porque esa persona se observa en una sola condición. Algunas definiciones para los efectos:μjkjkϵi(jk)i()jki

μj.=1qk=1qμjk (average expected value for treatment j of factor A)

μ.k=1pj=1pμjk (average expected value for treatment k of factor B)

αj=μj.μ (effect of treatment j of factor A, j=1pαj=0)

βk=μ.kμ (effect of treatment k of factor B, k=1qβk=0)

(αβ)jk=μjk(μ+αj+βk)=μjkμj.μ.k+μ
(interaction effect for the combination of treatment j of factor A with treatment k of factor B, j=1p(αβ)jk=0k=1q(αβ)jk=0)

αj(k)=μjkμ.k
(conditional main effect for treatment j of factor A within fixed treatment k of factor B, j=1pαj(k)=01qk=1qαj(k)=αjj,k)

βk(j)=μjkμj.
(conditional main effect for treatment k of factor B within fixed treatment j of factor A, k=1qβk(j)=01pj=1pβk(j)=βkj,k)

With these definitions, the model can also be written as: Yijk=μ+αj+βk+(αβ)jk+ϵi(jk)

This allows us to express the null hypothesis of no interaction in several equivalent ways:

  1. H0I:jk(αβ)jk2=0
    (all individual interaction terms are 0, such that μjk=μ+αj+βkj,k. This means that treatment effects of both factors - as defined above - are additive everywhere.)

  2. H0I:αj(k)αj(k)=0jk,k(kk)
    (all conditional main effects for any treatment j of factor A are the same, and therefore equal αj. This is essentially Dason's answer.)

  3. H0I:βk(j)βk(j)=0j,jk(jj)
    (all conditional main effects for any treatment k of factor B are the same, and therefore equal βk.)

  4. H0I: In a diagramm which shows the expected values μjk with the levels of factor A on the x-axis and the levels of factor B drawn as separate lines, the q different lines are parallel.

caracal
fuente
1
A really impressive answer Caracal - thank you.
Tal Galili
9

Una interacción nos dice que los niveles de factor A tienen diferentes efectos según el nivel de factor B que esté aplicando. Entonces podemos probar esto a través de un contraste lineal. Sea C = (A1B1 - A1B2) - (A2B1 - A2B2) donde A1B1 representa la media del grupo que recibió A1 y B1 y así sucesivamente. Así que aquí estamos viendo A1B1 - A1B2, que es el efecto que tiene el factor B cuando aplicamos A1. Si no hay interacción, esto debería ser el mismo que el efecto que B está teniendo cuando aplicamos A2: A2B1 - A2B2. Si esos son los mismos, entonces su diferencia debería ser 0, por lo que podríamos usar las pruebas:

H0 0:do=0 0vs.HUNA:do0.

Dason
fuente
1
Thanks Dason, that helped. Also, after reading your reply, it suddenly became clear to me that I am not fully sure how this generalizes in case we are having more factors. Could you advise? Thanks again. Tal
Tal Galili
2
You can test multiple contrasts simultaneously. So for example if A had three levels and B had 2 we could use the two contrasts: C1 = (A1B1 - A2B1) - (A2B1 - A2B2) and C2 = (A2B1 - A2B2) - (A3B1 - A3B2) and use a 2 degree of freedom test to simultaneously test if C1 = C2 = 0. It's also interesting to note that C2 could equally have been (A1B1 - A1B2) - (A3B1 - A3B2) and we would come up with the same thing.
Dason
Hi @Dason: you seem to have multiple accounts. Could you please complete the form at stats.stackexchange.com/contact and request that they be merged? That will simplify your use of this site (and give you the combined net reputation of both accounts).
whuber