La extracción de características y la selección de características esencialmente reducen la dimensionalidad de los datos, pero la extracción de características también hace que los datos sean más separables, si tengo razón.
¿Qué técnica se preferiría sobre la otra y cuándo?
Estaba pensando, dado que la selección de características no modifica los datos originales y sus propiedades, supongo que usará la selección de características cuando sea importante que las características en las que está entrenando no cambien. Pero no puedo imaginar por qué querrías algo así ...
Como dijo Aditya, hay 3 términos relacionados con características que a veces se confunden entre sí. Intentaré dar una explicación resumida a cada uno de ellos:
Si lo único que desea lograr es la reducción de la dimensionalidad en un conjunto de datos existente, puede usar la transformación de características o los métodos de selección de características. Pero si necesita conocer la interpretación física de las características que identifica como "importantes" o está tratando de limitar la cantidad de datos que deben recopilarse para su análisis (necesita todo el conjunto inicial de características para la transformación de características), entonces solo la selección de funciones puede funcionar.
Puede encontrar más detalles sobre la Selección de características y la Reducción de la dimensionalidad en los siguientes enlaces:
Un resumen de los métodos de reducción de dimensiones
Clasificación y selección de características: una revisión
Preguntas y respuestas relevantes en Stack Overflow
fuente
Creo que son 2 cosas diferentes,
Comencemos con la Selección de funciones :
Esta técnica se utiliza para seleccionar las características que explican la mayor parte de la variable objetivo (tiene una correlación con la variable objetivo). Esta prueba se ejecuta justo antes de que el modelo se aplique a los datos.
Para explicarlo mejor, veamos un ejemplo: hay 10 características y 1 variable objetivo, 9 características explican el 90% de la variable objetivo y 10 características juntas explican el 91% de la variable objetivo. Por lo tanto, la variable 1 no está haciendo una gran diferencia, por lo que tiende a eliminarla antes de modelar (también es subjetiva para el negocio). También se me puede llamar como Predictor Importance.
Ahora hablemos de la extracción de características ,
Que se utiliza en el aprendizaje no supervisado, extracción de contornos en imágenes, extracción de bi-gramos de un texto, extracción de fonemas de la grabación de texto hablado. Cuando no sabe nada sobre los datos, como ningún diccionario de datos, demasiadas características, lo que significa que los datos no están en un formato comprensible. Luego intente aplicar esta técnica para obtener algunas características que explican la mayor parte de los datos. La extracción de características implica una transformación de las características, que a menudo no es reversible porque parte de la información se pierde en el proceso de reducción de dimensionalidad.
Puede aplicar Extracción de características en los datos dados para extraer características y luego aplicar Selección de características con respecto a la Variable de destino para seleccionar el subconjunto que puede ayudar a hacer un buen modelo con buenos resultados.
puede pasar por estos Link-1 , Link-2 para una mejor comprensión.
podemos implementarlos en R, Python, SPSS.
avíseme si necesita más aclaraciones.
fuente
Los dos son muy diferentes: la selección de características reduce las dimensiones, pero la extracción de características agrega dimensiones que se calculan a partir de otras características.
Para los datos de panel o series de tiempo, uno generalmente tiene la variable de fecha y hora, y uno no quiere entrenar la variable dependiente en la fecha en sí misma, ya que esas no ocurren en el futuro. Por lo tanto, debe eliminar el datetime: eliminación de características.
Por otro lado, el día de la semana / fin de semana puede ser muy relevante, por lo que debemos calcular el estado de la semana a partir de la fecha y hora: extracción de características.
fuente
Cita: "Un aprendizaje práctico con SciKit-Learn, Keras y Tensorflow - Aurelien Geron"
fuente