¿Qué características se usan generalmente de los árboles Parse en el proceso de clasificación en PNL?

13

Estoy explorando diferentes tipos de estructuras de árbol de análisis. Las dos estructuras de árbol de análisis ampliamente conocidas son: a) árbol de análisis basado en la circunscripción yb) estructuras de árbol de análisis basadas en la dependencia.

Puedo usar generar ambos tipos de estructuras de árbol de análisis usando el paquete Stanford NLP. Sin embargo, no estoy seguro de cómo usar estas estructuras de árbol para mi tarea de clasificación.

Por ejemplo, si quiero hacer un análisis de sentimientos y quiero clasificar el texto en clases positivas y negativas, ¿qué características puedo derivar de las estructuras de árbol de análisis para mi tarea de clasificación?

machine-learning nlp feature-selection feature-extraction trabajando
fuente

9

Al usar un árbol de análisis, divide su oración en partes. Supongamos que, en el ejemplo del análisis de sentimientos, puede usar esas partes para asignar un sentimiento positivo / negativo a cada parte y luego tomar el efecto acumulativo de esas partes.

análisis de los sentimientos

Esta imagen te ayudará a entender más. La primera mitad tiene un sentimiento negativo (principalmente debido a la palabra "seco") pero debido a la palabra "pero" y al uso de la palabra "disfrutado", el sentimiento negativo se convierte en un sentimiento positivo.

En cuanto a su uso, simplemente puede generar una representación vectorial de palabras de las palabras individuales en la oración y usar neuronas en lugar de los nodos principales. Cada neurona debe estar conectada a otra neurona a través de pesas. Todos los nodos de la hoja serán las representaciones de vectores de palabras de las palabras de la oración. La neurona principal superior (en este caso, el símbolo azul + superior) debería generar un sentimiento positivo / negativo de acuerdo con la oración. Esta estructura de árbol se puede entrenar de manera supervisada.

Lea este documento para obtener más información.

Créditos de imagen: cs224.stanford.edu

Azrael
fuente

1

Creo que las dependencias se pueden usar para mejorar la precisión de su clasificador de sentimientos. Considere los siguientes ejemplos:

E1: Bill no es científico

y supongamos que el token "científico" tiene un sentimiento positivo en un dominio específico.

Conociendo la dependencia neg (científico, no) podemos ver que el ejemplo anterior tiene un sentimiento negativo. Sin conocer esta dependencia, probablemente clasificaríamos la oración como positiva.

Otros tipos de dependencias pueden usarse probablemente de la misma manera para mejorar la precisión de los clasificadores.

Pasmod Turing
fuente

¿Qué características se usan generalmente de los árboles Parse en el proceso de clasificación en PNL?

Respuestas: