Quizás esta pregunta sea ingenua, pero:
Si la regresión lineal está estrechamente relacionada con el coeficiente de correlación de Pearson, ¿hay alguna técnica de regresión estrechamente relacionada con los coeficientes de correlación de Kendall y Spearman?
regression
correlation
pearson-r
spearman-rho
kendall-tau
Miroslav Sabo
fuente
fuente
Respuestas:
Hay un medio muy sencillo por el cual usar casi cualquier medida de correlación para ajustar regresiones lineales, y que reproduce mínimos cuadrados cuando se usa la correlación de Pearson.
Esta definición funciona, por ejemplo, con todo tipo de correlaciones robustas y basadas en rangos. También se puede usar para obtener un intervalo para la pendiente (de la manera habitual, al encontrar las pendientes que marcan el límite entre correlaciones significativas y correlaciones insignificantes).
Aquí está la correlación trazada contra la pendiente para los
car
datos en R:La correlación de Pearson cruza 0 en la pendiente de mínimos cuadrados, 3.932
La correlación de Kendall cruza 0 en la pendiente de Theil-Sen, 3.667
La correlación de Spearman cruza 0 dando una pendiente de "línea de Spearman" de 3.714
Esas son las tres estimaciones de pendiente para nuestro ejemplo. Ahora necesitamos intercepciones. Por simplicidad, solo usaré la media residual para la primera intersección y la mediana para las otras dos (no importa mucho en este caso):
* (la pequeña diferencia de mínimos cuadrados se debe al error de redondeo en la estimación de la pendiente; sin duda, hay un error de redondeo similar en las otras estimaciones)
Las líneas ajustadas correspondientes (usando el mismo esquema de color que el anterior) son:
Editar: en comparación, la pendiente de correlación de cuadrante es 3.333
Tanto la correlación de Kendall como las pendientes de correlación de Spearman son sustancialmente más robustas a los valores atípicos influyentes que los mínimos cuadrados. Vea aquí un ejemplo dramático en el caso de Kendall.
fuente
El modelo PO es un caso especial de una familia más general de modelos de probabilidad acumulativa (algunos denominan enlace acumulativo) que incluyen los modelos probit, riesgos proporcionales y log-log complementarios. Para un estudio de caso, vea el Capítulo 15 de mis Folletos .
fuente
Aaron Han (1987 en econometría) propuso el estimador de Máxima correlación de rango que se ajusta a los modelos de regresión maximizando tau. Dougherty y Thomas (2012 en la literatura de psicología) recientemente propusieron un algoritmo muy similar. Hay una gran cantidad de trabajo en el MRC que ilustra sus propiedades.
Aaron K. Han, Análisis no paramétrico de un modelo de regresión generalizada: El estimador de correlación de rango máximo, Journal of Econometrics, Volumen 35, Problemas 2–3, julio de 1987, páginas 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )
Dougherty, MR y Thomas, RP (2012). Robusta toma de decisiones en un mundo no lineal. Revisión psicológica, 119 (2), 321. Recuperado de http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .
fuente