Soy muy nuevo en R. Estoy aprendiendo machine learning en este momento. Lo siento mucho, si esta pregunta parece ser muy básica. Estoy tratando de encontrar un buen paquete de selección de características en R. Revisé el paquete Boruta. Es un buen paquete, pero leí que solo es útil para la clasificación.
Quiero implementar la selección de características en R para tareas de regresión. Revisé la documentación del paquete caret, pero para mi nivel, es muy difícil de entender.
¿Alguien puede señalarme un buen tutorial o enumerar los paquetes buenos o los paquetes más utilizados en R para la selección de funciones?
Cualquier ayuda sería apreciada. Gracias por adelantado.
r
feature-selection
usuario1787687
fuente
fuente
Respuestas:
También puede echar un vistazo a FSelector , varSelRF . FSelector contiene múltiples funciones para la selección de características basadas, por ejemplo, en la prueba de chi cuadrado, en la teoría de la información (entropía, información mutua, relación de ganancia, ...), en la correlación entre característica, consistencia, etc. varSelRF es un paquete útil para la selección de características utilizando bosques aleatorios con eliminación de variables hacia atrás y con espectro de importancia.
fuente
¿Has mirado en el aprendizaje automático y estadístico de aprendizaje CRAN vista de tareas donde aparte símbolo de intercalación y Boruta bastante se mencionan algunos otros paquetes?
En general, si no comprende un procedimiento estadístico específico con respecto a la selección de funciones, podría ser mejor que haga una pregunta específica al respecto. El siguiente enlace de CV puede resultar bastante útil como un comienzo: Algoritmos para la selección automática de modelos .
fuente
Sugiero Rattle que tiene una selección aleatoria de características forestales (y mucho más). Tiene una GUI agradable y muy fácil de usar.
fuente
GLMNET con regresión de lazo tiene selección de características.
fuente
Además, el
Caret
paquete también proporciona métodos de selección de funciones. Aquí y aquí hay un par de tutoriales sobre el uso de la selección de funciones enCaret package
. Recientemente, un paquete de selección de características basado en el algoritmo SISAL de Tikka y Hollmén está disponible en el CRAN .fuente