¿Kendall Tau o el rho de Spearman?

69

¿En qué casos uno debería preferir el uno sobre el otro?

Encontré a alguien que reclama una ventaja para Kendall, por razones pedagógicas , ¿hay otras razones?

Tal Galili
fuente
Consulte también una pregunta relacionada stats.stackexchange.com/q/18112/3277 .
ttnphns
1
Desafortunadamente, el enlace en su pregunta está muerto. Supongo que se refiere a Noether (2007, Enseñanza de estadísticas ) . ¿Quieres editarlo en?
S. Kolassa - Restablece a Monica

Respuestas:

40

Descubrí que la correlación de Spearman se usa principalmente en lugar de la correlación lineal habitual cuando se trabaja con puntajes enteros en una escala de medición, cuando tiene un número moderado de puntajes posibles o cuando no queremos confiar en suposiciones sobre las relaciones bivariadas . En comparación con el coeficiente de Pearson, la interpretación de la tau de Kendall me parece menos directa que la del rho de Spearman, en el sentido de que cuantifica la diferencia entre el% de pares concordantes y discordantes entre todos los posibles eventos por pares. En mi opinión, el tau de Kendall se parece más a Goodman-Kruskal Gamma .

Acabo de leer un artículo de Larry Winner en J. Statistics Educ. (2006) que analiza el uso de ambas medidas, NASCAR Winston Cup Race Results for 1975-2003 .

También encontré interesante la respuesta de @onestop sobre la correlación de Pearson o Spearman con datos no normales a este respecto.

De nota, tau de Kendall (la una versión) tiene la conexión a Somers' D (y C de Harrell) usado para el modelado predictivo (véase, por ejemplo, Interpretación de Somers' D en cuatro modelos simples de RB Newson y la referencia 6 en la misma, y los artículos de Newson publicado en el Stata Journal 2006). Se proporciona una descripción general de las pruebas de suma de rango en Cálculo eficiente de los intervalos de confianza de Jackknife para estadísticas de rango , que se publicó en el JSS (2006).

chl
fuente
Gracias chl por la respuesta, la acepté por su alcance Best, Tal
Tal Galili
Spearman, utilizado en dos variables enteras, se compara regularmente con los vínculos, que parecen manejarse mejor con la tau de Kendall.
vinnief
29

Me refiero al honorable caballero a mi respuesta anterior : "... los intervalos de confianza para la r S de Spearman son menos confiables y menos interpretables que los intervalos de confianza para los parámetros τ de Kendall", según Kendall y Gibbons (1990).

una parada
fuente
1
Creo que las gracias se deben a Roger Newson, ya que solo estoy citando su artículo.
onestop
22

De nuevo respuesta algo filosófica; la diferencia básica es que el Rho de Spearman es un intento de extender la idea R ^ 2 (= "explicación de la varianza") sobre las interacciones no lineales, mientras que la Tau de Kendall pretende ser un estadístico de prueba para la prueba de correlación no lineal. Entonces, Tau debe usarse para probar correlaciones no lineales, Rho como extensión R (o para personas familiarizadas con R ^ 2; explicar Tau a un público desprevenido en un tiempo limitado es doloroso).


fuente
66
¿podría explicar "interacciones no lineales"? El Spearman Rho parece reflejar una medida del coeficiente de validez en términos de psicometría. No sé sobre la naturaleza de Tau.
Subhash C. Davar
No entiendo la cosa de psicometría de tu comentario.
Léo Léopold Hertz 준영
1
"interacciones no lineales" porque lo único que importa es el orden, no la correlación lineal. Por ejemplo, y tienen una correlación de Pearson de 0, mientras que la tau de Kendall o el rho de Spearman tendrán una puntuación de 1.x 2xx2
Yohan Obadia
1
Eso solo es cierto cuando x no es negativo.
aocall
17

Aquí hay una cita de Andrew Gilpin (1993) abogando por el τ de Kendall sobre el ρ de Spearman por razones teóricas:

"[De Kendall ] se aproxima a una distribución normal más rápidamente que , como , el tamaño de la muestra, se incrementa, y también es más manejable matemáticamente, en particular cuando los lazos están presentes." τρNτ

Referencia

Gilpin, AR (1993). Tabla de conversión de Tau de Kendall a Rho de Spearman dentro de las medidas de contexto de la magnitud del efecto para el metanálisis. Medición educativa y psicológica, 53 (1), 87-92.

Nick Stauner
fuente
3

FWIW, una cita de Myers & Well (diseño de investigación y análisis estadísticos, segunda edición, 2003, p. 510). Si todavía te importan los valores p;

Seigel y Castellan (1988, estadísticas no paramétricas para las ciencias del comportamiento) señalan que, aunque y Spearman generalmente tendrán valores diferentes cuando se calculan para el mismo conjunto de datos, cuando las pruebas de significación para y Spearman se basan en sus distribuciones de muestreo darán los mismos valores p .τρτρ

Burak Aydin
fuente
¿Sabes si ofrecen algún soporte para este reclamo? No veo cómo puede ser cierto en general (a menudo pueden ser similares, pero realmente no veo cómo puede sostenerse la afirmación de que serán iguales). [Me pregunto si Siegel y Castellan realmente dijeron exactamente eso, o algo ligeramente diferente.]
Glen_b
He comprobado Siegel y Castellan (2ed p253). Dicen algo ligeramente diferente ... pero en realidad es un poco peor que la paráfrasis anterior, incluso con la adición de "aproximadamente" (peor ya que restringen que sea el caso bajo nulo, pero ya que están condicionando los datos eso no ayudará. De todos modos, para un orden fijo de , todas las posibles órdenes de rango de son igualmente probables bajo H0.) El hecho de que piensen que el condicionamiento en el nulo después del condicionamiento en los datos es una preocupación. Me pregunto si querían decir algo más o si realmente lo malinterpretanxy
Glen_b
Como contraejemplo, tome n = 7 y valores p exactos. Sea x = 1,2,3,4,5,6,7 y sea y = 2,1,4,3,7,6,5 ... el lancero da p = 0.048, Kendall da 0.136 ... que son para nada igual. Una disposición diferente da el mismo valor para kendall pero Spearman tiene p = 0,302. Hay muchos ejemplos de este tipo y varios tamaños de muestra
Glen_b
3
Aquí hay una gráfica para el caso n = 8. Como puede ver, hay mucha variación entre los valores p para las dos medidas de correlación: i.stack.imgur.com/5JMbj.png ... Puedo escribir un Q&A sobre esto
Glen_b
1
Aquí hay dos conjuntos de datos de ejemplo (después de la clasificación) que muestran dos casos (esta vez con n = 9) donde los valores p de correlación de Spearman son los mismos, pero los valores p de correlación de Kendall son bastante diferentes: i.stack.imgur. com / 3ILD8.png
Glen_b