Hay muchas publicaciones en este SE que discuten enfoques sólidos para el análisis de componentes principales (PCA), pero no puedo encontrar una buena explicación de por qué PCA es sensible a los valores atípicos en primer lugar.
                26
            
  
            Hay muchas publicaciones en este SE que discuten enfoques sólidos para el análisis de componentes principales (PCA), pero no puedo encontrar una buena explicación de por qué PCA es sensible a los valores atípicos en primer lugar.
Respuestas:
Una de las razones es que PCA puede considerarse como una descomposición de bajo rango de los datos que minimiza la suma de las normasL2  de los residuos de la descomposición. Es decir, si Y  son sus datos ( metro  vectores de norte  dimensiones) y X  es la base PCA ( k  vectores de norte  dimensiones), entonces la descomposición minimizará estrictamente 
 ∥ Y- XUNA ∥2F= ∑j = 1metro∥Yj-XUNAj .∥2 UNA  es la matriz de coeficientes de descomposición de PCA y ∥ ⋅ ∥F  es una norma de Frobenius de la matriz
Debido a que el PCA minimiza las normasL2  (es decir, las normas cuadráticas) tiene los mismos problemas de mínimos cuadrados o de ajuste de un gaussiano al ser sensible a los valores atípicos. Debido a la cuadratura de las desviaciones de los valores atípicos, dominarán la norma total y, por lo tanto, impulsarán los componentes de PCA.  
fuente