Wikipedia dice
Métodos que se basan en una prueba ómnibus antes de proceder a comparaciones múltiples . Típicamente, estos métodos requieren una prueba de rango ANOVA / Tukey significativa antes de proceder a comparaciones múltiples. Estos métodos tienen un control "débil" del error tipo I.
La prueba F en ANOVA es un ejemplo de una prueba ómnibus, que prueba la importancia general del modelo. Una prueba F significativa significa que entre las medias probadas, al menos dos de las medias son significativamente diferentes, pero este resultado no especifica exactamente qué medias son diferentes una de la otra. En realidad, la prueba significa que las diferencias han sido hechas por el estadístico F cuadrático racional (F = MSB / MSW). Para determinar qué media difiere de otra media o qué contraste de medias son significativamente diferentes, se deben realizar pruebas post hoc (pruebas de comparación múltiple) o pruebas planificadas después de obtener una prueba F omnibus significativa. Se puede considerar el uso de la corrección de Bonferroni simple u otra corrección adecuada.
Por lo tanto, se utiliza una prueba general para evaluar la importancia general, mientras que la comparación múltiple es para determinar qué diferencias son significativas.
Pero si entiendo correctamente, el objetivo principal de la comparación múltiple es probar la importancia general, y también puede encontrar qué diferencias son significativas. En otras palabras, la comparación múltiple puede hacer lo que puede hacer un ómnibus. Entonces, ¿por qué necesitamos una prueba ómnibus?
Al probar m hipótesis, hay2metro combinaciones de hipótesis que uno puede probar. Una de ellas es la hipótesis "nula global", también conocida como la "hipótesis de intersección":∩H0 0yo .
Una prueba general suele ser un nombre para probar la hipótesis nula global. Un requisito mínimo básico de un procedimiento de prueba múltiple es el control de errores bajo el valor nulo global. Esto se conoce como control "FWER débil". Pero probablemente no se detendrá allí: con el propósito de inferencia en hipótesis particulares, querrá un procedimiento que ofrezca control FWER bajo cualquier combinación de nulos verdaderos. Esto se conoce como control "FWER fuerte".
fuente
Además de los cálculos asociados con las pruebas Pair-Wise, hay algo más por qué se usa ANOVA en lugar de hacer todas las pruebas PAIR-WISE.
A veces, es posible que aunque ANOVA rechace la hipótesis nula de que todas las medias de la población son iguales en algún nivel de confianza, pero si toma todas las pruebas por pares (digamos LSD), es posible que no encuentre ni siquiera al menos un par de medias que excede la diferencia en ese nivel de confianza.
Prueba matemática de la afirmación anterior, teniendo en cuenta las pruebas de FISHER'S LSD por parejas
aquí:Spags es la desviación estándar dentro de los cuadrados.
Toma el caso, cuando tenemosnorte grupos, entonces, tenemos norte( N- 1 ) / 2 pruebas por pares.
Suma todos esosnorte( N- 1 ) / 2 pruebas:
Después de dividir por( N- 1 ) (como es el DoF) y cuadratura en ambos lados:
en el LHS, obtenemos la misma cantidad utilizada en ANOVA; Sin embargo, en el RHS, obtenemos elnorte/ 2 * Estadística de prueba de ANOVA.
Entonces, incluso si todas las pruebas de LSD por pares juntas no pueden rechazar las hipótesis nulas, todavía hay una buena posibilidad de que ANOVA pueda rechazar las hipótesis nulas.
Por lo tanto, ANOVA contiene más información que en todas las pruebas de pares consideradas juntas.
PD: Disculpas por usar la imagen en lugar de escribir las ecuaciones.
fuente