Prueba de significancia sobre la diferencia del coeficiente de correlación de Spearman

13

(¡Muchas gracias por las respuestas rápidas! Hice un mal trabajo al hacer la pregunta, así que déjenme volver a intentarlo).

No sé cómo averiguar si la diferencia entre dos correlaciones de Spearman es estadísticamente significativa. Me gustaría saber cómo averiguarlo.

La razón que quería averiguar es que en el siguiente artículo: Interpretación semántica basada en Wikipedia para el procesamiento del lenguaje natural , por Gabrilovich y Markovitch ( Journal of Artificial Intelligence Research 34 (2009) 443-498).

En la Tabla 2 (p. 457), los autores muestran que su método (ESA-Wikipedia) logra una correlación de Spearman más alta y estadísticamente significativa que otros métodos, y me gustaría hacer lo mismo para mostrar que mi método es mejor que el anterior métodos para algún problema.

No sé cómo calcularon la significación estadística, y me gustaría saberlo. El autor del artículo afirmó que la correlación de rango de Spearman se trató como la correlación de Pearson. No estoy seguro de si esa es la forma correcta de hacerlo. Tengo dos correlaciones de Spearman y me gustaría saber si la diferencia entre ellas es estadísticamente significativa o no.

Soy consciente de que los sitios web, como http://faculty.vassar.edu/lowry/rdiff.html , proporcionan una calculadora en línea para obtener la diferencia entre dos correlaciones de Pearson. No puedo encontrar una calculadora en línea similar para la diferencia entre dos correlaciones de Spearman.

Una solución del enlace proporcionado por Peter Flom

NOTA: Los procedimientos solo admiten las correlaciones de Spearman que están por debajo de 0.6.

  1. Deje = el Fisher transformada de la correlación observada de conjunto A , z B = el Fisher transformada de la correlación observada de conjunto B .zUNUNzsisi

  2. Para , sea y A i = n z A - ( n - 1 ) z A i , donde z A i es la transformada de Fisher del conjunto A de la correlación de una sola omisión obtenida por eliminar ( x i , y i ) , volver a clasificar y volver a calcular la correlación. (Cada z A i se basa en n -yo=1,...,norteyUNyo=nortezUN-(norte-1)zUNyozUNyoUN(Xyo,yyo)zUNyo pares; cada eliminación es temporal, para que yo sólo, no es permanente.) Repita para el grupo B .norte-1si

  3. es la transformada Fisher de jackknifed. Repita para el grupoB.y¯UN=yUNyo/ /nortesi

  4. es la varianza de ˉ y A . Repita para el grupo B .vy¯UN=(yUNyo-y¯UN)2/ /(norte(norte-1))y¯UNsi

  5. Use una prueba -heteroscedastic (Welch-Satterthwaite) para comparar las dos estimaciones de jackknifed:t

, dondenAynBson el número de muestras de conjuntoAyBrespectivamente.

t=y¯UN-y¯sivy¯UN+vy¯si,df=(vy¯UN+vy¯si)2vy¯UN2norteUN-1+vy¯si2nortesi-1
norteUNnortesiUNsi

Antes de la primera edición

Tengo un conjunto de clasificación calificado por humanos (RANGO HUMANO), un conjunto de clasificación generado por el método popular utilizado actualmente (RANGO ACTUAL), y finalmente un conjunto de clasificación generado por mi método propuesto (RANGO MISMO) .

Calculé la correlación de Spearman entre HUMAN-RANKING y PRESENT-RANKING. Permítanme llamar a esto: PRESIDENTE HUMANO.

Luego descubrí la correlación de Spearman entre HUMAN-RANKING y MY-RANKING. Déjame llamar a esto: HUMAN-MY-SPEARMAN.

¿Cómo puedo saber si la diferencia entre HUMAN-MY-SPEARMAN y HUMAN-PRESENT-SPEARMAN es estadísticamente significativa?

Patrick Chan
fuente
2
Bienvenido Patrick Estoy luchando con el mismo problema pero con Pearson r. Si marca mis entradas, tendrá una idea de lo que puede hacer.
Adhesh Josh
Aunque podría tener dificultades para enmarcar esta pregunta en términos estadísticos, sería útil si supiéramos exactamente lo que le interesaba. ¿Le interesa la cercanía de la correlación (qué tan cerca se pronostican los puntajes entre sí) o la existencia de una relación? Más que casualidad. Dado que parece que tiene datos clasificados, repetidos en el tiempo, podría ser útil leer un poco sobre los coeficientes de correlación intraclase. Espero tener ese derecho, la pregunta no está completamente clara.
rosser
Gracias Adhesh y Rosser. Lamento mi pobre descripción de mi pregunta. Lo he reescrito. Espero que se haya convertido en una pregunta comprensible.
Patrick Chan
¡Hola! Actualmente estoy luchando con el mismo problema. ¿Por casualidad tiene un código listo que implemente su sugerencia? Además, ¿por qué solo funciona para valores de correlación por debajo de 0.6?
fsociety

Respuestas:

1

El documento que cita explica el método en los siguientes términos:

[...] mostramos la importancia estadística de la diferencia entre el rendimiento de la versión ESA-Wikipedia (26 de marzo de 2006) y la de otros algoritmos mediante el uso de la transformación z de Fisher (Press, Teukolsky, Vetterling y Flannery, Numerical Recetas en C: El arte de la computación científica, Cambridge University Press, 1997, Sección 14.5).

Le sugiero que siga esa referencia, o eche un vistazo a la página de Wikipedia en el coeficiente de Spearman para más detalles.

Guillermo G.
fuente
1
Gracias Guillermo Sospeché que trataron la correlación de rango de Spearman como la correlación de Pearson y calcularon la diferencia de dos correlaciones de Pearson. Sin embargo, me parece que no es la forma correcta de hacerlo, por lo que estoy haciendo una publicación aquí.
Patrick Chan
¿Quizás conoces una implementación que funcione (preferiblemente en línea) porque esto es lo que busca el OP?
chl