¿Alguien tiene experiencia con los enfoques para seleccionar el número de componentes principales dispersos para incluir en un modelo de regresión?
pca
sparse
regression-strategies
Frank Harrell
fuente
fuente
Respuestas:
Si bien no tengo información directa sobre su pregunta, me encontré con algunos documentos de investigación , que podrían ser de su interés. Eso es, por supuesto, si entiendo correctamente que está hablando de PCA escasa , regresión de componentes principales y temas relacionados. En ese caso, aquí están los documentos:
fuente
http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5876870&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5876870
Puedo publicar una copia si no eres miembro de ieee.
Esto es de un artículo que escribí en pregrado. Tuve un problema en el que necesitaba decidir cuántas dimensiones (la indexación semántica latente es similar a la PCA) para usar en mi modelo de regresión logística. Lo que hice fue elegir una métrica (es decir, la tasa de error cuando se usa una probabilidad de marcado de .5) y examiné la distribución de esta tasa de error para diferentes modelos entrenados en diferentes números de dimensiones. Luego elegí el modelo con la tasa de error más baja. Podría usar otras métricas como área bajo la curva ROC.
También podría usar algo como la regresión paso a paso para elegir el número de dimensiones para usted. ¿Qué tipo de regresión estás realizando específicamente?
¿Qué quieres decir con escaso por cierto?
fuente