Sé cómo calcular matemáticamente PCA y SVD, y sé que ambos se pueden aplicar a la regresión de mínimos cuadrados lineales.
La principal ventaja de SVD matemáticamente parece ser que se puede aplicar a matrices no cuadradas.
Ambos se centran en la descomposición de la matrizAdemás de la ventaja de SVD mencionada, ¿hay alguna ventaja adicional o información proporcionada al usar SVD sobre PCA?
Realmente estoy buscando la intuición en lugar de cualquier diferencia matemática.
pca
least-squares
svd
Baz
fuente
fuente
advantage... SVD over PCA
- svd y PCA no se pueden comparar como operación matemática y método analítico de datos. ¿Puede su pregunta ser algo sobre formas de hacer PCA ? ¿O qué preguntas?Respuestas:
Como dijeron @ttnphns y @ nick-cox, SVD es un método numérico y PCA es un enfoque de análisis (como mínimos cuadrados). Puede hacer PCA usando SVD, o puede hacer PCA haciendo la descomposición propia de (o X X T ), o puede hacer PCA usando muchos otros métodos, al igual que puede resolver mínimos cuadrados con una docena de algoritmos diferentes como el método de Newton o el descenso de gradiente o SVD, etc.XTX XXT
Entonces, no hay "ventaja" para SVD sobre PCA porque es como preguntar si el método de Newton es mejor que los mínimos cuadrados: los dos no son comparables.
fuente
La pregunta realmente es si debe hacer la normalización de Z-score de las columnas antes de aplicar la SVD. Esto se debe a que PCA es la transformación anterior seguida por la SVD. A veces hacer la normalización es bastante dañino. Si sus datos son, por ejemplo, recuentos de palabras (transformados) que son positivos, restar la media es definitivamente perjudicial. Esto se debe a que los ceros que representan la ausencia de una palabra en un documento se asignarán a números negativos de gran magnitud. En problemas lineales, la magnitud más alta debe usarse para representar el rango donde sus características son más sensibles. También dividir por la desviación estándar es perjudicial para este tipo de datos.
fuente