El análisis de correlación canónica (CCA) tiene como objetivo maximizar la correlación habitual del momento del producto de Pearson (es decir, el coeficiente de correlación lineal) de las combinaciones lineales de los dos conjuntos de datos.
Ahora, considere el hecho de que este coeficiente de correlación solo mide asociaciones lineales; esta es la razón por la cual también usamos, por ejemplo, coeficientes de correlación de Spearman- o Kendall- τ (rango) que miden conexiones monótonas arbitrarias (no necesariamente lineales) entre variables
Por lo tanto, estaba pensando en lo siguiente: una limitación de CCA es que solo trata de capturar la asociación lineal entre las combinaciones lineales formadas debido a su función objetivo. ¿No sería posible extender CCA en algún sentido maximizando, por ejemplo, Spearman- lugar de Pearson- r ?
¿Conduciría tal procedimiento a algo estadísticamente interpretable y significativo? (¿Tiene sentido, por ejemplo, realizar CCA en rangos ...?) Me pregunto si ayudaría cuando se trata de datos no normales ...
Respuestas:
Utilicé expansiones de spline cúbicas restringidas al calcular variables canónicas. Está agregando funciones básicas no lineales al análisis exactamente como agregaría nuevas características. Esto da como resultado un análisis no lineal de componentes principales. Ver la R
Hmisc
paquete 'stranscan
función para un ejemplo. Elhomals
paquete R lleva esto mucho más lejos.fuente
El método estándar de CCA funciona con la matriz de coeficientes de correlación de momento del producto. Para la mayor magnitud de CC, construye dos variables compuestas z1 (n) y z2 (n) mediante la combinación lineal de dos matices (con n filas y variables m1 y m2) de modo que se maximice abs (correlación (z1, z2)). Esta función objetivo se puede maximizar directamente incluso si la correlación (z1, z2) no es el momento del producto, sino que se define de manera diferente.
Mishra, SK (2009) "Una nota sobre el análisis de correlación canónica ordinal de dos conjuntos de puntajes de clasificación"
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
fuente