Al leer Wikipedia sobre el análisis de correlación canónica (CCA) para dos vectores aleatorios e , me preguntaba si la respuesta de componentes principales (PCA) es la misma que CCA cuando ?
9
Al leer Wikipedia sobre el análisis de correlación canónica (CCA) para dos vectores aleatorios e , me preguntaba si la respuesta de componentes principales (PCA) es la misma que CCA cuando ?
vectors X and Y
Es que dos variables (columnas de datos) o dos casos (filas); dado que vamos a realizar los análisis de variables. 2)X and Y are the same
¿Querías decir que X = Y o de alguna otra manera?Respuestas:
Let sean y sea matrices de datos, que representan dos conjuntos de datos con muestras (es decir, observaciones de sus vectores fila aleatorias y ) en cada uno de ellos.X n×p1 Y n×p2 n X Y
CCA busca una combinación lineal de variables en y una combinación lineal de variables en modo que estén correlacionadas al máximo entre sí; luego busca el siguiente par, bajo una restricción de correlación cero con el primer par; etc.p1 X p2 Y
En el caso (y ), cualquier combinación lineal en un conjunto de datos trivialmente tendrá correlación con la misma combinación lineal en otro conjunto de datos. Por lo tanto, todos los pares CCA tendrán correlaciones , y el orden de los pares es arbitrario. La única restricción restante es que las combinaciones lineales no deben estar correlacionadas entre sí. Hay infinitas formas de elegir combinaciones lineales no correlacionadas (tenga en cuenta que los pesos no tienen que ser ortogonales en el espacio -dimensional) y cualquiera de ellos producirá una solución CCA válida. De hecho, PCA proporciona una de estas formas, ya que dos PC tienen correlación cero.X=Y p1=p2=p 1 1 p p
Por lo tanto, la solución PCA será una solución CCA válida, pero hay un número infinito de soluciones CCA equivalentes en este caso.
Matemáticamente, CCA busca los vectores singulares derecho ( ) e izquierdo ( ) de , que en este caso es igual a , y cualquier vector es un vector propio. Entonces puede ser arbitrario. A continuación, CCA obtiene los pesos de combinación lineal como y . En este caso, se reduce a tomar una base arbitraria y transformarla con , que de hecho producirá direcciones no correlacionadas .a b C−1/2XXCXYC−1/2YY I a=b C−1/2XXa C−1/2YYb C−1/2XX
fuente