Estoy realizando comparaciones post hoc después de una prueba de Kruskal-Wallis. Estoy usando el paquete PMCMR .
> posthoc.kruskal.nemenyi.test( preference ~ instrument)
Pairwise comparisons using Tukey and Kramer (Nemenyi) test
with Tukey-Dist approximation for independent samples
data: preference by instrument
Cello Drums Guitar
Drums 0.157 - -
Guitar 0.400 0.953 -
Harp 0.013 0.783 0.458
P value adjustment method: none
Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L, :
Ties are present, p-values are not corrected.
Estoy confundido por el mensaje de advertencia. ¿Alguien puede explicar qué significa y cómo puedo corregirlo?
posthoc.kruskal.nemenyi.test()
. Así que ajusté los lazos ejecutando datosRespuestas:
Un empate significa que tiene varias observaciones que comparten el mismo valor (de ahí el mismo rango). Por ejemplo, una muestra consta de observaciones:1 , 3 , 3 , 5 , 10 , 10 , 10 . "3 "y"10 "son dos lazos, donde 3 tiene réplicas de 2 y 10 tiene réplicas de 3 . Tal muestra corresponde a las estadísticas de rango:1 , 2 , 2 , 4 , 5 , 5 , 5 .
Cuando hay vínculos, generalmente necesitamos romperlo (de lo contrario, probablemente recibirá el mensaje de advertencia como lo mostró). Y convencionalmente, rompemos los lazos en las estadísticas de rango, en contraste con los lazos en las observaciones originales. Dado que la prueba de Kruskal-Wallis utiliza estadísticas de rango, es suficiente para responder a su pregunta restringiendo el alcance a las estadísticas de rango.
Dos métodos de desempate son comunes, uno es "romper los vínculos al azar". Es decir, regeneramos distintos rangos al azar entre los lazos. Continuando con el ejemplo anterior, al empate "2 , 2 ", podemos dibujar dos números sin reemplazo del conjunto { 2 , 3 } , luego asígnelos a la segunda y tercera posición, por ejemplo, "3, 2". Del mismo modo, podemos hacer eso para el empate10 . Una posible estadística de rango ajustada puede ser1 , 3 , 2 , 4 , 6 , 5 , 7 , por lo tanto, los lazos se rompieron. La desventaja de este método es que puede obtener diferentes estadísticas de prueba entre diferentes análisis, ya que el desempate es aleatorio.
El segundo método es "promediar". Es decir, el promedio asigna a cada elemento vinculado el rango "promedio". Con este método, las estadísticas de clasificación originales se convierten en:1 , 2.5 , 2.5 , 4 , 6 , 6 , 6 . Este método esencialmente ajusta los lazos en lugar de romperlos.
En el software, puede especificar opciones de desempate para las cuales debe consultar la documentación de la función.
Para una discusión similar sobre este tema, vea ¿Cómo funciona el argumento ties.method de la función de rango de R?
fuente