¿Cómo puedo explicar la intuición detrás de ANOVA?

9

Necesito explicar la intuición detrás de lo que ANOVA le está haciendo a una persona no técnica. ¿Hay un visual que explique la idea? ¿Podría ser útil un visual que ilustre la idea clave en el contexto de un ANOVA unidireccional con quizás 3 niveles de factores?

Supongamos que la persona ha tomado algunos cursos de estadística como estudiante en el pasado distante pero ha olvidado los detalles de incluso realizar una prueba z. Sin embargo, él / ella recuerda que las pruebas de hipótesis se utilizan para verificar si los efectos observados se deben al azar o a un cambio real en el parámetro de interés.

stats_student
fuente
1
Agregue a su pregunta qué espera que tenga el oyente para el conocimiento de estadísticas. ¿Conocen una prueba t? ¿Están familiarizados con las pruebas de hipótesis? ... etc. Si no tienen ninguno, no hay muchos detalles en los que quisiera entrar.
John
3
De posible interés: ¿Cómo visualizar lo que hace ANOVA?
chl
1
¿Qué tal usar un ejemplo de tres fuegos artificiales explotando en el cielo? Las tres alturas de explosión serían su medio grupal. Dadas las mismas tres alturas, la diferencia puede sentirse mayor si el radio de explosión de fuegos artificiales es pequeño (bajo dentro de la variación del grupo); y también pueden sentirse indiferentes si el radio de explosión es enorme en relación con sus diferencias de altura de explosión. Por lo tanto, se deben considerar tanto las alturas de explosión (entre) como el radio de explosión (dentro).
Penguin_Knight
El libro en línea de David Lane me pareció muy útil. onlinestatbook.com/2/analysis_of_variance/intro.html
idnavid
Escribí una explicación completamente no matemática de por qué usamos las varianzas para comparar medias. Aquí hay un enlace a la publicación del blog.
Peter Flom

Respuestas:

10

ANOVA es una técnica estadística utilizada para determinar si una clasificación particular de los datos es útil para comprender la variación de un resultado. Piense en dividir a las personas en cubos o clases según algunos criterios, como residencia suburbana y urbana. La variación total en la variable dependiente (el resultado que le interesa, como la respuesta a una campaña publicitaria) puede descomponerse en la variación entre clases y la variación dentro declases Cuando la variación dentro de la clase es pequeña en relación con la variación entre clases, su esquema de clasificación es, en cierto sentido, significativo o útil para comprender el mundo. Los miembros de cada grupo se comportan de manera similar entre sí, pero las personas de diferentes grupos se comportan de manera distintiva. Esta descomposición se utiliza para crear una prueba F formal de esta hipótesis.

Dimitriy V. Masterov
fuente
1

El libro en línea de David Lane me pareció muy útil.

De una manera más fundamental, hay un artículo invitado en Annals of Statistics de TP Speed ​​llamado "¿Qué es el análisis de varianza?". Me tomó algunos intentos, pero al final fue muy informativo. La esencia del trabajo es mostrar que ANOVA es simplemente una descomposición de la varianza en una suma de varianzas que pertenecen a grupos más pequeños. Otra conclusión importante es que puede usar ANOVA para variaciones más generales (covarianzas), lo que me pareció interesante.

idnavid
fuente
-1

Podría explicar que ANOVA es una descomposición de los datos como componentes que corresponden a diferentes grupos o variables o fuentes de variación . Un ejemplo es

(8988979484779279818787858792898479818088)=(8686868686868686868686868686868686868686)+(-6 6-6 6-6 6-6 6-3-3-3-3-1-1-1-1-2-2-2-2-4 4-4 4-4 4-4 4)+(-2-130 0-2-130 0-2-130 0-2-130 0-2-130 0)+(-1-3-2-2-3-5 5-6 6-4 4-2-3-1-0 0-1-5 5-2-4 4-1-0 0-5 5-6 6)

que representa observaciones de un diseño ANOVA de dos vías (sin replicación), con filas y columnas como los dos grupos. El modelo algebraico es
ytyo=μ+βyo+τt+ϵtyo
y la descomposición de datos correspondiente se calcula como
ytyo=y¯+{y¯yo-y¯}+{y¯t-y¯}+{ytyo-y¯yo-y¯t+y¯}.
Para ANOVA unidireccional, un ejemplo es
(6263685660 6067666263717160 6059646761sesenta y cinco68636668646359)=(646464646464646464646464646464646464646464646464)+(-324 4-3-324 4-3-324 4-3-324 4-324 4-324 4-3-3-3)+(-1-3-0 0-5 5-1-1-2-1-2-5 5-3-1-2-2-1-0 0-1-0 0-2-0 0-0 0-3-2-2)
y el álgebra se puede escribir de la misma manera.

Esto es principalmente un comentario, ya que no es una explicación completa, pero podría ser un componente útil de cualquier explicación y podría adaptarse al nivel necesario. Tales tablas se usan mucho en este famoso libro .

kjetil b halvorsen
fuente
¿Por qué el voto negativo?
kjetil b halvorsen