¿Cómo aplicar redes neuronales en problemas de clasificación de etiquetas múltiples?

12

Descripción:

Deje que el dominio del problema sea la clasificación de documentos donde existe un conjunto de vectores de características, cada uno de los cuales pertenece a 1 o más clases. Por ejemplo, un documento doc_1puede pertenecer a Sportsy Englishcategorías.

Pregunta:

Usando la red neuronal para la clasificación, ¿cuál sería la etiqueta para un vector de características? ¿Sería un vector que constituye todas las clases de manera que se dé 0 valor a las clases no relevantes y 1 para las clases relevantes? Entonces, si la lista de etiquetas de clase es [Sports, News, Action, English, Japanese], entonces, ¿para doc_1qué documento sería la etiqueta [1, 0, 0, 1, 0]?

Curioso
fuente

Respuestas:

3

Sí, en el aprendizaje de etiquetas múltiples, la información de la etiqueta a menudo se codifica como el vector binario que usted describió. También es más fácil para la evaluación.

Es posible que deseemos consultar MULAN , una biblioteca Java de código abierto para el aprendizaje de etiquetas múltiples. Es una extensión de Weka y ha implementado muchos clasificadores de etiquetas múltiples, incluidas las redes neuronales. Por ejemplo, puede encontrar BP-MLL aquí .

Weiwei
fuente
8

Este parece ser el papel que está buscando:

Min-Ling Zhang y Zhi-Hua Zhou: redes neuronales de etiquetas múltiples con aplicaciones a la genómica funcional y categorización de texto

Del resumen:

En el aprendizaje de etiquetas múltiples, cada instancia en el conjunto de capacitación está asociada con un conjunto de etiquetas, y la tarea es generar un conjunto de etiquetas cuyo tamaño se desconoce a priori para cada instancia invisible. En este documento, este problema se aborda en el forma en que se propone un algoritmo de red neuronal denominado BP-MLL, es decir, Backpropagation for Multi-Label Learning. ... Las aplicaciones a dos problemas de aprendizaje multi-etiqueta del mundo real, es decir, genómica funcional y categorización de texto, muestran que el rendimiento de BP-MLL es superior al de algunos algoritmos de aprendizaje multi-etiqueta bien establecidos.

steffen
fuente