¿Cómo interpretar ANOVA y MANOVA tipo I, tipo II y tipo III?

45

Mi pregunta principal es cómo interpretar la salida (coeficientes, F, P) al realizar un ANOVA tipo I (secuencial).

Mi problema de investigación específico es un poco más complejo, por lo que dividiré mi ejemplo en partes. Primero, si estoy interesado en el efecto de la densidad de la araña (X1) en el crecimiento de la planta (Y1) y planto plántulas en recintos y manipulo la densidad de la araña, entonces puedo analizar los datos con un ANOVA simple o regresión lineal. Entonces no importaría si usara la suma de cuadrados (SS) Tipo I, II o III para mi ANOVA. En mi caso, tengo 4 réplicas de 5 niveles de densidad, por lo que puedo usar la densidad como factor o como variable continua. En este caso, prefiero interpretarlo como una variable continua independiente (predictor). En RI podría ejecutar lo siguiente:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

Es de esperar que la ejecución de la función anova tenga sentido para una comparación posterior, así que ignore la rareza aquí. El resultado es:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

Ahora, supongamos que sospecho que el nivel inicial de nitrógeno inorgánico en el suelo, que no pude controlar, también puede haber afectado significativamente el crecimiento de la planta. No estoy particularmente interesado en este efecto, pero me gustaría dar cuenta de la variación que causa. Realmente, mi interés principal está en los efectos de la densidad de la araña (hipótesis: el aumento de la densidad de la araña causa un mayor crecimiento de las plantas, presumiblemente a través de la reducción de los insectos herbívoros, pero solo estoy probando el efecto, no el mecanismo). Podría agregar el efecto de N inorgánico a mi análisis.

En aras de mi pregunta, supongamos que pruebo la densidad de interacción * inorganicN y no es significativa, así que la elimino del análisis y ejecuto los siguientes efectos principales:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

Ahora, hace una diferencia si uso SS Tipo I o Tipo II (sé que algunas personas se oponen a los términos Tipo I y II, etc., pero dada la popularidad de SAS es fácil de usar). R anova {stats} usa el Tipo I por defecto. Puedo calcular el tipo II SS, F y P para la densidad invirtiendo el orden de mis efectos principales o puedo usar el paquete "auto" del Dr. John Fox (compañero de la regresión aplicada). Prefiero el último método ya que es más fácil para problemas más complejos.

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

Tengo entendido que las hipótesis de tipo II serían: "No hay un efecto lineal de x1 en y1 dado el efecto de (¿constante?) X2" y lo mismo para x2 dado x1. Supongo que aquí es donde me confundo. ¿Cuál es la hipótesis que ANOVA está probando utilizando el método de tipo I (secuencial) anterior en comparación con la hipótesis que utiliza el método de tipo II?

En realidad, mis datos son un poco más complejos porque midí numerosas métricas de crecimiento de las plantas, así como la dinámica de los nutrientes y la descomposición de la basura. Mi análisis real es algo así como:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           
djhocking
fuente

Respuestas:

71

nn11n12n21n22r=.1res 'significativo', esta es toda la población que le importa). El problema con los factores que se están correlacionados es que hay sumas de cuadrados que están asociados con ambos A y B. Cuando se calcula un ANOVA (o cualquier otra regresión lineal), queremos particionar las sumas de cuadrados. Una partición pone todas las sumas de cuadrados en uno y solo unode varios subconjuntos. (Por ejemplo, podríamos querer dividir el SS en A, B y error). Sin embargo, dado que sus factores (todavía aquí solo A y B) no son ortogonales, no existe una partición única de estos SS. De hecho, puede haber muchas particiones, y si está dispuesto a dividir su SS en fracciones (por ejemplo, "pondré .5 en este contenedor y .5 en ese"), hay particiones infinitas. Una forma de visualizar esto es imaginar el símbolo de MasterCard: el rectángulo representa el SS total, y cada uno de los círculos representa el SS atribuible a ese factor, pero observe la superposición entre los círculos en el centro, esos SS podrían recibir a cualquier círculo

ingrese la descripción de la imagen aquí

La pregunta es: ¿cómo vamos a elegir la partición "correcta" de todas estas posibilidades? Volvamos a la interacción y analicemos algunas posibilidades:

Tipo I SS:

  • SS (A)
  • SS (B | A)
  • SS (A * B | A, B)

Tipo II SS:

  • SS (A | B)
  • SS (B | A)
  • SS (A * B | A, B)

Tipo III SS:

  • SS (A | B, A * B)
  • SS (B | A, A * B)
  • SS (A * B | A, B)

Observe cómo funcionan estas diferentes posibilidades. Solo el tipo I SS realmente usa esos SS en la parte superpuesta entre los círculos en el símbolo de MasterCard. Es decir, las SS que podría atribuirse a A o B, están en realidad atribuida a uno de ellos cuando se utiliza el tipo I SS (en concreto, la que introdujo en el modelo primero). En los otros dos enfoques, las SS superpuestas no se utilizan en absoluto . Por lo tanto, el tipo I SS le da a A todos los SS atribuibles a A (incluidos los que también podrían haberse atribuido en otro lugar), luego le da a B todos los SS restantes que son atribuibles a B, luego le da a la interacción A * B todo del restoSS que son atribuibles a A * B, y deja los restos que no podrían atribuirse a nada al término del error.

El tipo III SS solo le da a A aquellos SS que son únicamente atribuibles a A, del mismo modo solo le da a B y la interacción aquellos SS que son únicamente atribuibles a ellos. El término de error solo obtiene esos SS que no se pueden atribuir a ninguno de los factores. Por lo tanto, esas SS 'ambiguas' que podrían atribuirse a 2 o más posibilidades no se utilizan. Si suma el SS tipo III en una tabla ANOVA, notará que no son iguales al SS total. En otras palabras, este análisis debe estar equivocado, pero se equivoca de una manera epistemológicamente conservadora. Muchos estadísticos consideran este enfoque atroz, sin embargo, las agencias de financiación del gobierno (creo que la FDA) requieren su uso.

El enfoque de tipo II está destinado a capturar lo que podría valer la pena sobre la idea detrás del tipo III, pero mitigar sus excesos. Específicamente, solo ajusta el SS para A y B entre sí, no la interacción. Sin embargo, en la práctica, el tipo II SS esencialmente nunca se usa. Debería saber todo esto y ser lo suficientemente inteligente con su software para obtener estas estimaciones, y los analistas que generalmente piensan que esto es una tontería.

Hay más tipos de SS (creo que IV y V). Se les sugirió a finales de los años 60 para tratar ciertas situaciones, pero luego se demostró que no hacen lo que se pensaba. Por lo tanto, en este punto son solo una nota al pie histórica.

En cuanto a qué preguntas están respondiendo, básicamente ya tiene ese derecho en su pregunta:

  • Las estimaciones que utilizan SS tipo I le indican qué parte de la variabilidad en Y puede explicarse por A, qué parte de la variabilidad residual puede explicarse por B, qué parte de la variabilidad residual restante puede explicarse por la interacción, etc. con el fin .
  • Las estimaciones basadas en SS tipo III le indican qué parte de la variabilidad residual en Y puede explicarse por A después de haber contado todo lo demás, y qué parte de la variabilidad residual en Y puede explicarse por B después de haber explicado todo lo demás también, y así sucesivamente. (Tenga en cuenta que ambos van primero y duran simultáneamente; si esto tiene sentido para usted y refleja con precisión su pregunta de investigación, entonces use SS tipo III).
gung - Restablece a Monica
fuente
2
Gracias por la respuesta tan útil. La otra área en la que me confundo es que si "Las estimaciones que usan SS de tipo I le dicen qué parte de la variabilidad en Y puede explicarse por A, qué parte de la variabilidad residual puede explicarse por B, cuánto del resto residual la variabilidad puede explicarse por la interacción, y así sucesivamente, "entonces, ¿por qué las estadísticas se asocian con un cambio A cuando se agregan variables adicionales? ¿Es porque las pruebas se basan en SS (A) / SS (error) y el error es una función de todos los términos en el modelo? ¿Estoy pensando en esto correctamente?
djhocking
1
Por "estadísticas asociadas con A", interpreto que se refiere a los valores F y p para el efecto principal de A. El valor F para A es la relación del cuadrado medio para A (es decir, SSA / dfA) a Error de MS A medida que agrega más factores, las SS se toman del término de error y se asignan a esos factores. En general, esto significa que el error de MS disminuye y, por lo tanto, la proporción aumenta. Como resultado, el valor F para A se hace más grande y el valor p se hace más pequeño. Debido a que los grados de libertad también cambian, puede ser más complicado que esto, pero eso es lo esencial.
gung - Restablece a Monica
Vaya, me refería a MS (A) / MSE para la estadística F. De todos modos, su respuesta es perfecta, ¡gracias de nuevo por toda su ayuda!
djhocking el
Tengo curiosidad sobre los detalles de interpretación cuando uso un tipo I. En mi caso, la densidad es mi única variable de interés y la única que manipulé experimentalmente. Sin embargo, desafortunadamente, la densidad es insignificante por sí misma o después de tener en cuenta mis otras dos variables de interés (Npredators, inorganicN en tipo II o III). Pero debido a que inorganicN aparentemente explica gran parte de la variación en algunas de las variables dependientes cuando la agrego como la tercera variable, hace que las otras 2 sean altamente significativas. Por lo tanto, ¿la densidad realmente tiene un efecto significativo en Y? ¿Es esto razonable?
djhocking
2
@ JonBonJovi, la analogía de MasterCard solo tiene 2 factores. Si desea 2 factores más una interacción, necesitaría 3 áreas que se superpongan entre sí. Ciertamente es posible dibujar un diagrama de Euler con 3 áreas, pero simplemente utilicé el símbolo de MasterCard por simplicidad. Para una interacción, imagine un tercer círculo que se superpone a los primeros 2 (por ejemplo, podría estar centrado de derecha a izquierda, pero sobre todo por encima de los demás); entonces todo el círculo A (SS) iría a A, todo en B que no se superpone A va a B, y todo en A B que no se superpone * A o B va a la interacción.
gung - Restablece a Monica