PCA se considera un procedimiento lineal, sin embargo:
donde . Esto quiere decir que los vectores propios obtenidos por los PCA en las matrices de datos no suman igual a los vectores propios obtenidos por PCA en la suma de las matrices de datos . Pero no es la definición de una función lineal que:
Entonces, ¿por qué la PCA se considera "lineal" si no satisface esta condición básica de linealidad?
Respuestas:
Cuando decimos que PCA es un método lineal, nos referimos al mapeo reductor de dimensionalidad desde el espacio de alta dimensión a un espacio de menor dimensión . En PCA, este mapeo viene dado por la multiplicación de por la matriz de vectores propios de PCA y por lo tanto es manifiestamente lineal (la multiplicación de la matriz es lineal):Esto está en contraste con los métodos no lineales de reducción de dimensionalidad , donde el mapeo de reducción de dimensionalidad puede ser no lineal.R p R k x z = f ( x ) = V ⊤ x .F: x ↦ z Rpags Rk X
Por otro lado, los vectores propios superiores se calculan a partir de la matriz de datos usando lo que usted llamó en su pregunta: y este mapeo es ciertamente no lineal: implica el cálculo de vectores propios de la matriz de covarianza, que es un procedimiento no lineal . (Como un ejemplo trivial, multiplicar por aumenta la matriz de covarianza por , pero sus vectores propios permanecen igual ya que están normalizados para tener unidades de longitud).V ∈ R p × k X ∈ R n × p P C A ( ) V = P C A ( X ) , X 2 4k V ∈ Rp × k X ∈ Rn × p P C A ()
fuente
"Lineal" puede significar muchas cosas, y no se emplea exclusivamente de manera formal.
PCA a menudo no se define como una función en el sentido formal y, por lo tanto, no se espera que cumpla los requisitos de una función lineal cuando se describe como tal. Se describe con mayor frecuencia, como dijiste, como un procedimiento y, a veces, como un algoritmo (aunque no me gusta esta última opción). A menudo se dice que es lineal de una manera informal, no bien definida.
PCA puede considerarse lineal, por ejemplo, en el siguiente sentido. Pertenece a una familia de métodos que consideran que cada variable se puede aproximar mediante una función donde e es un conjunto de variables con algunas características deseables. propiedad. En el caso de PCA, es un conjunto de variables independientes que pueden reducirse en cardinalidad con una pérdida mínima en la precisión de aproximación en un sentido específico. Esas son propiedades deseables en numerosos entornos.X i ≈ f Y ( α ) α ∈ R k Y k YXyo
Ahora, por PCA, cada se limita a la forma que es, una combinación lineal de las variables en .f Y ( α ) = k ∑ i = 1 α i Y i YFyo
Dada esta restricción, ofrece un procedimiento para encontrar los valores óptimos (en cierto sentido) de y los . Es decir, PCA solo considera funciones lineales como hipótesis plausibles. En este sentido, creo que puede describirse legítimamente como "lineal".α i jY αyo j
fuente
PCA proporciona / es una transformación lineal.
Como comparación, un ejemplo muy simple de un proceso que usa una transformación lineal pero no es una transformación lineal en sí misma:
y
pero
Esta duplicación del ángulo, que implica el cálculo de ángulos, no es lineal, y es análoga a la afirmación de la ameba, que el cálculo del vector propio no es lineal.
fuente