Estoy usando R para el análisis de datos. R proporciona una corr
función para calcular la correlación. Esta función proporciona tres enfoques / algoritmos diferentes para estimar los corr
que son Pearson, Spearman y Kendall. ¿Cuándo debo usar cada uno de estos métodos? ¿Qué factores determinan qué método debe usarse?
correlation
r
Asheeshr
fuente
fuente
Respuestas:
El coeficiente de momento del producto de Pearson (parámetro de Pearson) mide la correlación lineal entre variables. Por lo tanto, es apropiado cuando su sospecha de correlación es lineal, lo que puede inspeccionarse visualmente con un gráfico.
El coeficiente de Kendall Tau (parámetro de kendall) y el coeficiente de correlación de Spearman (parámetro de Spearman) son correlaciones de rango de medidas. Por lo tanto, la correlación entre las dos variables no necesita ser lineal. El método de Spearman es básicamente el método de Pearson, pero se aplica en los rangos de los valores (el rango de un valor viene dado por su posición después de ordenar los valores). El método kendal se construye básicamente como una estadística en forma de una relación entre el número adicional de pares ordenados y el número total de pares. Para el método kendal, debido a que se construye como una estadística, uno puede usarlo también en el marco de la prueba de hipótesis, con todos los beneficios (se llama prueba tau).
Todos estos métodos son instrumentos utilizados para inferir algo sobre las dependencias entre variables aleatorias. Ver más en la página dedicada de Wikipedia dedicada a la correlación y la dependencia
fuente