¿Qué pregunta responde ANOVA?

9

Quiero aprender ANOVA. Antes de comenzar a aprender cómo funciona el algoritmo (qué cálculos deben hacerse) y por qué funciona, primero me gustaría saber qué problema resolvemos realmente con ANOVA, o qué respuesta tratamos de responder. En otras palabras: ¿qué es entrada y qué salida del algoritmo?

Entiendo lo que usamos como entrada. Tenemos un conjunto de números. Cada número viene con valores de una o más variables categóricas (también conocidas como "factores"). Por ejemplo:

+------------+------------+-------+
|   factor 1 |   factor 2 | value |
+------------+------------+-------+
|     "A"    |     "a"    |  1.0  |
|     "A"    |     "a"    |  2.4  |
|     "A"    |     "b"    |  0.3  |
|     "A"    |     "b"    |  7.4  |
|     "B"    |     "a"    |  1.2  |
|     "B"    |     "a"    |  8.4  |
|     "B"    |     "b"    |  0.4  |
|     "B"    |     "b"    |  7.2  |
+------------+------------+-------+

¿Es correcto decir que ANOVA calcula el valor p de la hipótesis nula que establece que los factores no tienen ningún efecto sobre la media de los valores? En otras palabras, le damos los datos dados al algoritmo y, como resultado, obtenemos el valor p de la hipótesis nula.

Si es el caso, ¿qué medida usamos realmente para calcular el valor p? Por ejemplo, podemos decir que, dada la hipótesis nula, M puede ser tan alta como la observada (o incluso más alta) por casualidad en el 1% de los casos. ¿Qué es la M?

¿No investigamos también los factores en ANOVA por separado? ¿Puede ANOVA decir que factor_1 tiene un efecto pero factor_2 no? ¿Puede ANOVA decir que para un factor dado los valores correspondientes a los valores "A", "B" y "C" son estadísticamente indistinguibles (tienen la misma media, por ejemplo) pero el valor "D" tiene un efecto?

romano
fuente

Respuestas:

6

ANOVA significa "Análisis de varianza". Como era de esperar, analiza la varianza.

Seamos un poco más explícitos. Sus observaciones exhibirán alguna variación. Si agrupa sus observaciones por su factor 1, la varianza dentro de los grupos definidos por el factor 1 será menor que la varianza general. El factor 1 "explica la varianza".

Sin embargo, esto no es suficiente para concluir que el factor 1 en realidad tiene una relación con sus observaciones ... porque la agrupación por cualquier cosa "explicará" la varianza. Lo bueno es que sabemos cuánta varianza se explicará bajo la hipótesis nula de que su factor, de hecho, no tiene nada que ver con sus observaciones. Esta cantidad de varianza explicada bajo nulo se describe mediante una distribuciónF

Por lo tanto, la estrategia en ANOVA es estimar la varianza general y la varianza dentro de los grupos (usando sumas de cuadrados) y tomar proporciones de estas varianzas estimadas. Esta relación es la estadísticaLuego comparamos esta estadística con el valor crítico de la distribución en una prueba unilateral, obteniendo su valor . El número de niveles de factores entra en un parámetro de la distribución (más niveles de factores explicarán más varianza bajo la hipótesis nula), y el número de observaciones y el número de niveles van al otro. Esta pregunta anterior puede ser útil.FFFpF

(¿Por qué una prueba unilateral? Debido a que, como se indicó anteriormente, cualquier agrupación explicará alguna variación, por lo que solo tiene sentido verificar si su factor explica una cantidad significativamente grande de variación).

La sección "Ejemplo de motivación" de la entrada de Wikipedia proporciona algunas ilustraciones muy agradables de factores que explican muy poco, algo y mucha de la variación general.

El ANOVA bidireccional y las interacciones, como en su ejemplo, así como el ANCOVA, son solo generalizaciones sobre este tema. En cada caso, investigamos si agregar alguna variable explicativa explica una cantidad de varianza significativamente grande.

Una vez que tenemos una prueba de global significativa , podemos examinar si las observaciones de ciertos niveles de factores son significativamente diferentes a otras en las pruebas post-hoc . Por ejemplo, D puede ser diferente de A, B y C, pero pueden no ser significativamente diferentes entre sí. Por lo general, utilizará pruebas para esto. Esta pregunta anterior puede ser útil, así como esta .Ft

Stephan Kolassa
fuente
Entonces, usamos todos los números para calcular la varianza general , luego calculamos las varianzas para cada grupo y finalmente combinamos todas estas varianzas (probablemente también con los tamaños de los grupos) para obtener la "medida": . Luego calculamos la probabilidad de que M sea tan grande como sea o incluso mayor suponiendo que la hipótesis nula sea correcta. VviMETRO=METRO(V,v1,v2,...,vk,norte1,norte2,...,nortek)
Romano
Exactamente. es tu estadísticaAquí está la fórmula real. METROF
Stephan Kolassa
Para ser sincero, todavía estoy un poco confundido. Hasta donde te tengo, ANOVA devuelve el valor p de la hipótesis nula. Pero, por otro lado, del "Ejemplo de motivación" de Wikipedia se puede concluir que ANOVA nos da el mejor factor (o una combinación de factores), que "explica" los datos de la mejor manera. Entonces, en el ejemplo, ANOVA dice que la raza es el mejor factor para explicar el peso de los perros.
Romano
1
"Best" está cargado. Esto se desvía al territorio de selección por modelo escalonado basado en valores p, y eso es problemático. No leas demasiado al ejemplo motivador. Lo mejor de esto es la descripción de la varianza explicada (cero, poco, mucho). Es mejor ir hacia abajo y leer acerca de cómo se calcula el estadístico en base a sumas de cuadrados, y recordar que esas sumas de cuadrados son solo estimadores de varianzas. F
Stephan Kolassa