¿Hay algún recurso con una lista de técnicas de ingeniería de características? Un mapeo de tipo de datos, modelo y técnica de ingeniería de características sería una mina de oro
9
¿Hay algún recurso con una lista de técnicas de ingeniería de características? Un mapeo de tipo de datos, modelo y técnica de ingeniería de características sería una mina de oro
Respuestas:
No hay una fuente definida sobre cómo hacer ingeniería de características. A menudo depende del problema que está tratando de resolver. Algunos dicen que es más un arte que una ciencia.
Pero revisaría algunos de los núcleos de kaggle de alto puntaje / soluciones ganadoras si están disponibles. Simplemente dirígete a kaggle y navega por las competiciones. Hay mucho material muy útil allí.
Además, el diario de investigación de aprendizaje automático tiene muchos documentos sobre ingeniería de características. Simplemente busque en su sitio http://www.jmlr.org/ .
Los siguientes enlaces son útiles y largos parafrasear:
fuente
Imputación de datos faltantes:
Análisis de caso completo
Imputación media / mediana / moda
Imputación de muestras aleatorias
Reemplazo por valor arbitrario
Indicador de valor perdido
Imputación multivariante
Codificación categórica:
Una codificación activa
Codificación de conteo y frecuencia
Codificación objetivo / codificación media
Codificación ordinal
Peso de la evidencia
Codificación de etiqueta rara
BaseN, hashing de características y otros
Transformación Variable:
Logaritmo
Recíproco
Raíz cuadrada
Exponencial
Yeo-Johnson
Box-Cox
Discretización:
Discretización de frecuencia igual
Discretización de igual longitud
Discretización con arboles
Discretización con ChiMerge
Eliminación de valores atípicos:
Eliminar valores atípicos
Tratar los valores atípicos como NaN
Taponado, Windsorización
Escalado de características:
Estandarización
Escala MinMax
Escala media
Max Absolute Scaling
Unidad de escalado de normas
Ingeniería de fecha y hora:
Creación de características:
Agregando datos de transacciones:
Extracción de características del texto:
Bolsa de palabras
tfidf
n-gramos
word2vec
extracción de temas
Y finalmente extrayendo características de las imágenes.
Un buen artículo que describe la mayoría de las técnicas anteriores: Ingeniería de características una descripción completa
Una buena lista de recursos para aprender más sobre ingeniería de características: los mejores recursos para aprender sobre ingeniería de características
Las herramientas de Python para la ingeniería de características se pueden encontrar en este hilo
DESCARGO DE RESPONSABILIDAD: Escribí los 2 artículos, y también soy el creador de 1 de los cursos recomendados para aprender sobre ingeniería de características.
fuente