Hoja de trucos ANOVA Alfabeto Sopa y equivalentes de regresión

18

¿Puedo obtener ayuda para completar este intento tentativo (en progreso) de orientarme en los equivalentes de ANOVA y REGRESIÓN? He estado tratando de conciliar los conceptos, la nomenclatura y la sintaxis de estas dos metodologías. Hay muchas publicaciones en este sitio sobre sus puntos en común, por ejemplo esto o esto , pero aún así es bueno tener un mapa rápido de "estás aquí" al comenzar.

Planeo actualizar esta publicación y espero obtener ayuda para corregir errores.

ANOVA unidireccional:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

ANOVA bidireccional:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANOVA factorial bidireccional:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

DENTRO DEL FACTOR (o SUJETO) ANOVA: ( código aquí )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( código aquí )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

DISEÑO ANIDADO: ( código aquí )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

SITIOS ÚTILES:

  1. RExRepos
  2. Proyecto de personalidad
  3. Quick-R
  4. R-Bloggers
  5. Análisis anidado y parcela dividida por M. Crawley
  6. Modelos con múltiples efectos aleatorios
  7. Modelos de parcelas divididas
  8. El libro R de M. Crawley
  9. Dentro de grupos y medidas repetidas
  10. Repetir medidas en R
  11. Preguntas frecuentes de GLMM
Antoni Parellada
fuente
Una nota: para sus ejemplos ANOVA de 2 vías (directo y factorial) su escenario / sintaxis es cyl + hp. Horespower es continuo, por lo que no funciona aquí. carb, el número de carburadores sería una mejor opción.
Gregor
¡Gracias! Error por descuido. Gracias a su nota, también detecté que cyl fue tratado como continuo, así que lo cambié a as.factor Y, incluí TukeyHSD.
Antoni Parellada
1
Creo que deberías eliminar 'Survival' del título, ya que es un área muy específica de estadísticas completamente ajena a lo que estás (muy bien) resumiendo.
Bryan Hanson
Bonito resumen Antoni! Tal vez también podría agregar los glmmFAQ de Ben Bolker y quizás algunos ejemplos simples de binomio y Poisson (GLM y GLMM). Pero entiendo que esto puede complicar demasiado las cosas y quita este resumen agradable y conciso. Alternativamente, puede vincular a ejemplos en este sitio. Para un ejemplo completo simple de Poisson / binomio negativo, esto puede funcionar: stats.stackexchange.com/questions/325334/…
Stefan

Respuestas:

2

Buena lista, Antoni. Aquí hay algunas sugerencias menores:

ANOVA unidireccional: IV es un FACTOR con 3 o más niveles. También puede agregar un ejemplo de datos: mtcars a esta entrada. (Del mismo modo, puede agregar declaraciones de "Datos de ejemplo" a todas sus entradas, para que quede más claro qué conjuntos de datos está utilizando).

Anova de dos vías: ¿Por qué no usar IV1 y IV2 y afirmar que las dos variables independientes deben ser factores con al menos dos niveles cada una? La forma en que lo expresó actualmente sugiere que una anova bidireccional podría incluir más de 2 variables (o factores) independientes, lo que no es sensorial.

Para Anova de dos vías, diferenciaría entre estos dos casos secundarios: 1. Anova de dos vías con efectos principales para IV1 y IV2 y 2. Anova de dos vías con una interacción entre IV1 y IV2. Este segundo elemento es a lo que se refiere dos como un anova factorial de dos vías.) Una mejor manera de describir estos dos sub-casos sería: 1. El efecto de IV1 en DV es independiente del efecto de IV2 y 2. Efecto de IV1 en DV depende de IV2. También podría aclarar que las variables independientes IV1 y IV2 están codificadas en la configuración de regresión.

Para ANCOVA, podría aclarar que está considerando solo ANCOVA unidireccional en su ejemplo actual. Para completar, puede agregar un ejemplo ANCOVA de dos vías sin interacciones entre IV1 y IV2, y uno con interacción entre estas dos variables.

Para todo lo anterior, también puede agregar un elemento llamado Propósito , que describe cuándo son útiles estos análisis. Por ejemplo:

Propósito (de anova unidireccional): investigar si los valores medios de la DV son diferentes en los niveles de la IV.

Para MANOVA, ¿puede aclarar que uno necesitaría (a) dos o más DV y (2) uno o más IV que son factores? ¿Supongo que puedes diferenciar entre MANOVA unidireccional (con 1 factor) y MANOVA bidireccional? Lo mismo para MANCOVA.

El ANOVA DENTRO DEL FACTOR también se conoce como ANOVA DE MEDIDAS REPETIDAS, por lo que quizás pueda agregar esta terminología a su lista para aquellos que estén familiarizados con él. También sería útil aclarar que el modelado de efectos mixtos proporciona una forma alternativa de modelar datos de medidas repetidas. De lo contrario, los lectores podrían no apreciar la diferencia entre los dos enfoques.

Isabella Ghement
fuente
Es más fácil para mí proporcionar sugerencias en lugar de hacer ediciones. ”
Isabella Ghement