¿Cuál es la mejor manera de clasificar los enfoques que se han desarrollado para tratar el problema de la clase de desequilibrio?
Este artículo los clasifica en:
- Preprocesamiento: incluye métodos de sobremuestreo, submuestreo e híbridos,
- Aprendizaje sensible al costo: incluye métodos directos y metaaprendizaje que este último divide en umbrales y muestreo,
- Técnicas de conjunto: incluye conjuntos sensibles al costo y preprocesamiento de datos junto con el aprendizaje de conjunto.
La segunda clasificación:
- Preprocesamiento de datos: incluye cambio de distribución y ponderación del espacio de datos. El aprendizaje de una clase se considera un cambio de distribución.
- Métodos de aprendizaje especiales
- Postprocesamiento de predicción: incluye método de umbral y postprocesamiento sensible al costo
- Métodos híbridos
El tercer artículo :
- Métodos a nivel de datos
- Métodos a nivel de algoritmo
- Métodos híbridos
La última clasificación también considera el ajuste del producto como un enfoque independiente.
Gracias por adelantado.
Respuestas:
A mi modo de ver, las tres categorizaciones concuerdan en muchas cosas. Por ejemplo, los tres tienen una categoría para los pasos de preprocesamiento.
En general, estoy de acuerdo con la tercera categorización, ya que es más genérica y abarca más cosas.
Lo único que falta en los dos primeros artículos son los pasos posteriores al procesamiento, que para ser sinceros, no se usan en la práctica tan a menudo como el otro.
fuente