Me gustaría probar mi modelo entrenado en un conjunto de datos desequilibrado. ¿Hay algún algoritmo disponible para generar datos sintéticos a partir de un conjunto de datos etiquetado equilibrado (spam / no spam)?
unbalanced-classes
synthetic-data
Stuart Peterson
fuente
fuente
Respuestas:
Pruebe SMOTE , es un algoritmo utilizado para sobremuestreo . Crea muestras sintéticas de la clase que desea sobremuestrear.
Puede usar esto para crear cualquier cantidad de muestras que necesite.
fuente