Hay diferencias en los supuestos y las hipótesis que se prueban.
El ANOVA (y la prueba t) es explícitamente una prueba de igualdad de medios de valores. El Kruskal-Wallis (y Mann-Whitney) puede verse técnicamente como una comparación de los rangos medios .
Por lo tanto, en términos de valores originales, el Kruskal-Wallis es más general que una comparación de medios: prueba si la probabilidad de que una observación aleatoria de cada grupo sea igualmente probable o superior a una observación aleatoria de otro grupo. La cantidad de datos reales que subyace a esa comparación no son las diferencias en las medias ni la diferencia en las medianas, (en el caso de dos muestras) es en realidad la mediana de todas las diferencias por pares: la diferencia de Hodges-Lehmann entre muestras.
Sin embargo, si opta por hacer algunas suposiciones restrictivas, entonces Kruskal-Wallis puede verse como una prueba de igualdad de los medios de población, así como los cuantiles (por ejemplo, medianas) y, de hecho, una amplia variedad de otras medidas. Es decir, si supone que las distribuciones grupales bajo la hipótesis nula son las mismas, y que bajo la alternativa, el único cambio es un cambio distributivo (una llamada " alternativa de cambio de ubicación "), entonces también es una prueba de igualdad de los medios de población (y, simultáneamente, de medianas, cuartiles inferiores, etc.).
[Si hace esa suposición, puede obtener estimaciones e intervalos para los cambios relativos, tal como puede hacerlo con ANOVA. Bueno, también es posible obtener intervalos sin esa suposición, pero son más difíciles de interpretar.]
Si observa la respuesta aquí , especialmente hacia el final, analiza la comparación entre la prueba t y el Wilcoxon-Mann-Whitney, que (al hacer pruebas de dos colas al menos) son el equivalente de ANOVA y Kruskal-Wallis aplicado a una comparación de solo dos muestras; da un poco más de detalle, y gran parte de esa discusión se traslada a Kruskal-Wallis vs ANOVA.
No está completamente claro qué quieres decir con una diferencia práctica. Los usas generalmente de una manera generalmente similar. Cuando se aplican ambos conjuntos de supuestos, generalmente tienden a dar resultados bastante similares, pero ciertamente pueden dar valores p bastante diferentes en algunas situaciones.
Editar: Aquí hay un ejemplo de la similitud de inferencia incluso en muestras pequeñas: aquí está la región de aceptación conjunta para los cambios de ubicación entre tres grupos (el segundo y el tercero en comparación con el primero) muestreados de distribuciones normales (con tamaños de muestra pequeños) para un conjunto de datos en particular, al nivel del 5%:
Se pueden distinguir numerosas características interesantes: la región de aceptación ligeramente más grande para el KW en este caso, con su límite que consiste en segmentos de línea recta vertical, horizontal y diagonal (no es difícil entender por qué). Las dos regiones nos dicen cosas muy similares sobre los parámetros de interés aquí.
Sí hay. El
anova
es un enfoque paramétrico mientras quekruskal.test
es un enfoque no paramétrico. Porkruskal.test
lo tanto , no necesita ningún supuesto de distribución.Desde el punto de vista práctico, cuando sus datos están sesgados,
anova
no sería un buen enfoque para su uso. Eche un vistazo a esta pregunta, por ejemplo.fuente
Como dije al principio, no estoy seguro acerca de la construcción precisa de KW. Tal vez mi respuesta sea más correcta para otra prueba no paramétrica (Mann-Whitney? ..), pero el enfoque debería ser similar.
fuente
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersion
Como se menciona en la respuesta de Glen, los comentarios y en muchos otros lugares de este sitio, es cierto, pero es la lectura limitada de lo que hace la prueba.same shape/dispersion
en realidad no es intrínseco, pero es una suposición adicional que se usa en algunos y no en otras situaciones.distributions are equal
, es un error pensar que sí. El H0 es solo que, por lo general, los dos puntos de "condensación de las gravedades" no se desvían entre sí.krusal.test()
the equality of the location parameters of the distribution
es la formulación correcta (aunque "ubicación" no debe considerarse como una media o mediana, en general). Si asume las mismas formas, entonces, naturalmente, este mismo H0 se convierte en "distribución idéntica".Kruskal-Wallis se basa en el rango, más que en el valor. Esto puede hacer una gran diferencia si hay distribuciones asimétricas o si hay casos extremos
fuente