¿Qué métodos de correlación robustos se utilizan realmente?

18

Planeo hacer un estudio de simulación donde comparo el desempeño de varias técnicas de correlación robustas con diferentes distribuciones (sesgadas, con valores atípicos, etc.). Con robusto , me refiero al caso ideal de ser robusto contra a) distribuciones sesgadas, b) valores atípicos yc) colas pesadas.

Junto con la correlación de Pearson como línea de base, estaba pensando en incluir las siguientes medidas más sólidas:

  • Ρ de Spearmanρ
  • Porcentaje de correlación de curvatura (Wilcox, 1994, [1])
  • Volumen mínimo elipsoide, determinante de covarianza mínima ( cov.mve/ cov.mcdcon la cor=TRUEopción)
  • Probablemente, la correlación winorizada

Por supuesto, hay muchas más opciones (especialmente si también incluye técnicas de regresión robustas), pero quiero limitarme a los enfoques más utilizados / más prometedores.

Ahora tengo tres preguntas (siéntase libre de responder solo):

  1. ¿Existen otros métodos correlacionales robustos que podría / debería incluir?
  2. ¿Qué técnicas de correlación robustas se utilizan realmente en su campo? (Hablando para la investigación psicológica: Excepto de Spearman , nunca he visto una técnica de correlación robusta fuera de un documento técnico. Bootstrapping se está volviendo cada vez más popular, pero otras estadísticas robustas son más o menos inexistentes hasta ahora).ρ
  3. ¿Existen ya comparaciones sistemáticas de técnicas de correlación múltiple que conozca?

También siéntase libre de comentar la lista de métodos dados anteriormente.


[1] Wilcox, RR (1994). El porcentaje de coeficiente de correlación de doblez. Psychometrika , 59, 601-616.

Felix S
fuente

Respuestas:

3

Desde una perspectiva psicológica, la correlación de Pearson y Spearman parece ser la más común. Sin embargo, creo que muchos investigadores en psicología participan en varios procedimientos de manipulación de datos en variables constituyentes antes de realizar la correlación de Pearson. Me imagino que cualquier examen de robustez debería considerar los efectos de:

  • transformaciones de una o ambas variables para hacer que las variables se aproximen a una distribución normal
  • ajuste o eliminación de valores atípicos basados ​​en una regla estadística o conocimiento de problemas con una observación
Jeromy Anglim
fuente
1

Te recomendaría este excelente artículo publicado en Science en 2011 que publiqué anteriormente aquí. Se propone una nueva medida robusta junto con una comparación exhaustiva y excelente con otras. Además, todas las medidas se prueban en robustez. Tenga en cuenta que esta nueva medida también es capaz de identificar más de una relación funcional en los datos y también para identificar relaciones no funcionales.

Miroslav Sabo
fuente
¡Excelente! Lo examinaré muy de cerca. Parece muy prometedor ...
Felix S
1
¿Puedes poner el nombre del artículo por favor? ¡Parece haber desaparecido!
Creatron
2
Detección de nuevas asociaciones en grandes conjuntos de datos
Miroslav Sabo
66
Ese artículo ha recibido muchas críticas. Parece estar sobrevalorado. Montones, montones y montones de medios y relaciones públicas funcionan, pero parece fallar gravemente en ejemplos triviales como ▄▀, que reconoce como "lineal". IIRC su estudio tampoco fue justo, ya que utilizaron filas para su propio método; pero comparado con Pearson en lugar de la correlación de Spearman.
Anony-Mousse -Reinstalar a Monica
8
Específicamente, vea las refutaciones de este enfoque en: statweb.stanford.edu/~tibs/reshef/comment.pdf , ie.technion.ac.il/~gorfinm/files/science6.pdf , arxiv.org/abs/1301.7745v1
metapertura
1

La tau de Kendall es muy utilizada en la teoría de la cópula, probablemente porque es algo muy natural a tener en cuenta para las cópulas arquímedes. Genest y Rivest introdujeron tramas de la Kenu tau acumulativa como una forma de elegir un modelo entre las familias de cópulas bivariadas.

Enlace al documento de Genest Rivest (1993)

Flounderer
fuente
1

Algunas medidas robustas de correlación son:

  1. Coeficiente de correlación de rango de Spearman

  2. Coeficiente de correlación de Signum (Blomqvist)

  3. Kendall's Tau

  4. Coeficiente de correlación absoluta de Bradley

  5. Coeficiente de correlación de Shevlyakov

Referencias

• Blomqvist, N. (1950) "Sobre una medida de dependencia entre dos variables aleatorias", Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) "La correlación absoluta", The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) "Sobre la estimación robusta de un coeficiente de correlación", Journal of Mathematical Sciences, 83 (3): 434-438. • Spearman, C. (1904) "La prueba y la medición de la asociación entre dos cosas", American Journal of Psychology, 15: 88-93.

Sudhanshu K Mishra
fuente