Necesito explicar la intuición detrás de lo que ANOVA le está haciendo a una persona no técnica. ¿Hay un visual que explique la idea? ¿Podría ser útil un visual que ilustre la idea clave en el contexto de un ANOVA unidireccional con quizás 3 niveles de factores?
Supongamos que la persona ha tomado algunos cursos de estadística como estudiante en el pasado distante pero ha olvidado los detalles de incluso realizar una prueba z. Sin embargo, él / ella recuerda que las pruebas de hipótesis se utilizan para verificar si los efectos observados se deben al azar o a un cambio real en el parámetro de interés.
Respuestas:
ANOVA es una técnica estadística utilizada para determinar si una clasificación particular de los datos es útil para comprender la variación de un resultado. Piense en dividir a las personas en cubos o clases según algunos criterios, como residencia suburbana y urbana. La variación total en la variable dependiente (el resultado que le interesa, como la respuesta a una campaña publicitaria) puede descomponerse en la variación entre clases y la variación dentro declases Cuando la variación dentro de la clase es pequeña en relación con la variación entre clases, su esquema de clasificación es, en cierto sentido, significativo o útil para comprender el mundo. Los miembros de cada grupo se comportan de manera similar entre sí, pero las personas de diferentes grupos se comportan de manera distintiva. Esta descomposición se utiliza para crear una prueba F formal de esta hipótesis.
fuente
El libro en línea de David Lane me pareció muy útil.
De una manera más fundamental, hay un artículo invitado en Annals of Statistics de TP Speed llamado "¿Qué es el análisis de varianza?". Me tomó algunos intentos, pero al final fue muy informativo. La esencia del trabajo es mostrar que ANOVA es simplemente una descomposición de la varianza en una suma de varianzas que pertenecen a grupos más pequeños. Otra conclusión importante es que puede usar ANOVA para variaciones más generales (covarianzas), lo que me pareció interesante.
fuente
Podría explicar que ANOVA es una descomposición de los datos como componentes que corresponden a diferentes grupos o variables o fuentes de variación . Un ejemplo es⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8984818779887787928197928789809479858488⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜8686868686868686868686868686868686868686⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4- 6- 3- 1- 2- 4⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 2- 2- 2- 2- 2- 1- 1- 1- 1- 1333330 00 00 00 00 0⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 3- 2- 1- 1- 3- 5- 3- 5- 0- 2- 6- 1- 2- 5- 2- 4- 0- 4- 6⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟ yt i= μ +βyo+τt+ϵt i y la descomposición de datos correspondiente se calcula como
yt i=y¯+ {y¯yo-y¯} + {y¯t-y¯} + {yt i-y¯yo-y¯t+y¯} .
Para ANOVA unidireccional, un ejemplo es
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜6260 60635963677164sesenta y cinco66686671676868566260 606163646359⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜646464646464646464646464646464646464646464646464⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 3- 3- 3- 32222224 44 44 44 44 44 4- 3- 3- 3- 3- 3- 3- 3- 3⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜- 1- 1- 2- 2- 3- 1- 5- 2- 1- 0- 0- 2- 3- 1- 0- 0- 5- 1- 1- 0- 2- 3- 2- 2⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ y el álgebra se puede escribir de la misma manera.
que representa observaciones de un diseño ANOVA de dos vías (sin replicación), con filas y columnas como los dos grupos. El modelo algebraico es
Esto es principalmente un comentario, ya que no es una explicación completa, pero podría ser un componente útil de cualquier explicación y podría adaptarse al nivel necesario. Tales tablas se usan mucho en este famoso libro .
fuente