Estoy tratando de entender las diferencias entre los métodos de reducción de dimensionalidad lineal (por ejemplo, PCA) y los no lineales (por ejemplo, Isomap).
No puedo entender lo que implica la (no) linealidad en este contexto. Leí de Wikipedia que
En comparación, si se utiliza PCA (un algoritmo de reducción de dimensionalidad lineal) para reducir este mismo conjunto de datos en dos dimensiones, los valores resultantes no están tan bien organizados. Esto demuestra que los vectores de alta dimensión (cada uno representa una letra 'A') que muestrean esta variedad varían de manera no lineal.
Que hace
Los vectores de alta dimensión (cada uno representa una letra 'A') que muestrean esta variedad varían de manera no lineal.
¿media? O, en términos más generales, ¿cómo entiendo la (no) linealidad en este contexto?
fuente
Una imagen vale mas que mil palabras:
Aquí estamos buscando una estructura unidimensional en 2D. Los puntos se encuentran a lo largo de una curva en forma de S. PCA intenta describir los datos con una variedad lineal unidimensional, que es simplemente una línea; por supuesto, una línea se ajusta bastante mal a estos datos. Isomap está buscando una variedad unidimensional no lineal (es decir, ¡curvada!), Y debería poder descubrir la curva en forma de S subyacente.
fuente