Planeo hacer un estudio de simulación donde comparo el desempeño de varias técnicas de correlación robustas con diferentes distribuciones (sesgadas, con valores atípicos, etc.). Con robusto , me refiero al caso ideal de ser robusto contra a) distribuciones sesgadas, b) valores atípicos yc) colas pesadas.
Junto con la correlación de Pearson como línea de base, estaba pensando en incluir las siguientes medidas más sólidas:
- Ρ de Spearman
- Porcentaje de correlación de curvatura (Wilcox, 1994, [1])
- Volumen mínimo elipsoide, determinante de covarianza mínima (
cov.mve
/cov.mcd
con lacor=TRUE
opción) - Probablemente, la correlación winorizada
Por supuesto, hay muchas más opciones (especialmente si también incluye técnicas de regresión robustas), pero quiero limitarme a los enfoques más utilizados / más prometedores.
Ahora tengo tres preguntas (siéntase libre de responder solo):
- ¿Existen otros métodos correlacionales robustos que podría / debería incluir?
- ¿Qué técnicas de correlación robustas se utilizan realmente en su campo? (Hablando para la investigación psicológica: Excepto de Spearman , nunca he visto una técnica de correlación robusta fuera de un documento técnico. Bootstrapping se está volviendo cada vez más popular, pero otras estadísticas robustas son más o menos inexistentes hasta ahora).
- ¿Existen ya comparaciones sistemáticas de técnicas de correlación múltiple que conozca?
También siéntase libre de comentar la lista de métodos dados anteriormente.
[1] Wilcox, RR (1994). El porcentaje de coeficiente de correlación de doblez. Psychometrika , 59, 601-616.
fuente
La tau de Kendall es muy utilizada en la teoría de la cópula, probablemente porque es algo muy natural a tener en cuenta para las cópulas arquímedes. Genest y Rivest introdujeron tramas de la Kenu tau acumulativa como una forma de elegir un modelo entre las familias de cópulas bivariadas.
Enlace al documento de Genest Rivest (1993)
fuente
Algunas medidas robustas de correlación son:
Coeficiente de correlación de rango de Spearman
Coeficiente de correlación de Signum (Blomqvist)
Kendall's Tau
Coeficiente de correlación absoluta de Bradley
Coeficiente de correlación de Shevlyakov
Referencias
• Blomqvist, N. (1950) "Sobre una medida de dependencia entre dos variables aleatorias", Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) "La correlación absoluta", The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) "Sobre la estimación robusta de un coeficiente de correlación", Journal of Mathematical Sciences, 83 (3): 434-438. • Spearman, C. (1904) "La prueba y la medición de la asociación entre dos cosas", American Journal of Psychology, 15: 88-93.
fuente
Bicorrelación media implementada en R (muy rápido) a través de WGCNA y en Python (no tan rápido) a través de la astropía . Esa es mi opción para el análisis de redes.
Para datos de composición dispersos, también hay SparCC y FastSpar
fuente