¿Cómo abordo un problema de clasificación en el que una de las clases se define por "ninguna de las otras"

Supongamos que estoy interesado en tres clases , , . Pero mi conjunto de datos en realidad contiene varias clases reales más . $c_1$ $c_2$ $c_3$ $(c_j)_{j=4}^n$

La respuesta obvia es definir una nueva clase $\hat c_4$ que se refiera a todas las clases $c_j$ , $j>3$ pero sospecho que no es una buena idea ya que las muestras en $\hat c_4$ serán raras y no muy similares entre sí.

Para visualizar lo que estoy tratando de decir, suponga que tengo los siguientes dos espacios variables y las clases $c_1$ , $c_2$ , $c_3$ , $\hat c_4= \bigcup_{j=4}^n c_j$ se representan en rojo, til, verde y negro respectivamente. Así es como sospecho que se verían mis datos.

¿Hay alguna forma estándar de abordar este problema? ¿Cuál sería el clasificador más eficiente y por qué?

machine-learning classification h3h325
fuente

Considere usar one vs. rest en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest

DaL

Es posible que desee explorar modelos positivos sin etiqueta . Parece un problema similar, excepto que es multiclase, no binario como la mayoría de los problemas de PU.

Ricardo Cruz

Respuestas:

un enfoque de dos pasos, usando la idea de la clase que mencionaste. $\hat{c_4}$

En el primer paso, use un clasificador binario (entrenado en todo el conjunto de datos) para decidir si una muestra pertenece a la clase (es decir, en cualquier clase no interesante). Para esto, paso también puede echar un vistazo a los métodos de detección de valores atípicos , si las muestras que pertenecen a las clases "interesantes" son muy diferentes al resto. $\hat{c_4}$

Si el resultado es negativo, pase al siguiente paso, un nuevo clasificador entrenado solo en muestras que pertenecen a las clases y use esa predicción como la final. $c_1,c_2,c_3$

Creo que incluso usando un enfoque de agrupación simple como primer paso (por ejemplo, 4-agrupaciones k-significa usar como valores de centroide iniciales el centroide promedio para cada ), aún sería útil. $cent_j = \frac{\sum\limits_{x_i\in D: y_i=j}x_i}{\sum\limits_{x_i\in D: y_i=j}1}$ $c_1,c_2,c_3, \hat{c_4}$

Bogas
fuente

La sugerencia de Bogas es excelente si no tiene mucha superposición de clases. De lo contrario, vaya con un modelo de etiqueta múltiple.

Ricardo Cruz

Este es un en.wikipedia.org/wiki/Cascading_classifiers

Emre