¿Cuál es la diferencia entre un analizador de constituyentes y un analizador de dependencias ? ¿Cuáles son los diferentes usos de los dos?
Un árbol de análisis de constituyentes divide un texto en subfrases. Los no terminales en el árbol son tipos de frases, los terminales son las palabras en la oración y los bordes no están etiquetados. Para una oración simple "John ve a Bill", un análisis de circunscripción sería:
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
Un análisis de dependencia conecta palabras de acuerdo con sus relaciones. Cada vértice del árbol representa una palabra, los nodos secundarios son palabras que dependen del padre y los bordes están etiquetados por la relación. Un análisis de dependencia de "John ve a Bill" sería:
sees
|
+--------------+
subject | | object
| |
John Bill
Debe utilizar el tipo de analizador que más le acerque a su objetivo. Si está interesado en subfrases dentro de la oración, probablemente desee el análisis de la circunscripción. Si está interesado en las relaciones de dependencia entre palabras, probablemente desee el análisis de dependencia.
El analizador de Stanford puede ofrecerle una ( demostración en línea ). De hecho, la forma en que realmente funciona es analizar siempre la oración con el analizador de constituyentes y luego, si es necesario, realiza una transformación determinista (basada en reglas) en el árbol de análisis de constituyentes para convertirlo en un árbol de dependencia.
Puede encontrar más aquí: