Entiendo que PCA se usa para la reducción de dimensionalidad para poder trazar conjuntos de datos en 2D o 3D. Pero también he visto personas que aplican PCA como un paso de preprocesamiento en escenarios de clasificación donde aplican PCA para reducir el número de características, luego usan algunos Componentes Principales (los vectores propios de la matriz de covarianza) como las nuevas características.
Mis preguntas:
¿Qué efectos tiene eso en el desempeño de la clasificación?
¿Cuándo aplicar tal paso de preprocesamiento?
Tengo un conjunto de datos con 10 características como números reales y 600 características binarias que representan características categóricas, utilizando codificación de uno a muchos para representarlas. ¿Tendría sentido aplicar PCA aquí y obtener mejores resultados?
PD: si la pregunta es demasiado amplia, le agradecería que proporcione un documento o tutoriales que expliquen mejor los detalles del uso de PCA de esa manera.
ps después de leer un poco, descubrí que podría ser mejor usar el análisis semántico latente para reducir el número de características binarias para los atributos categóricos. Por lo tanto, no toco las características de valor real, sino que solo preproceso las características binarias y luego combino las características de valor real con las nuevas características y entreno mi clasificador. ¿Qué piensas?
fuente