Recientemente comencé a experimentar con el procesamiento del lenguaje natural (NLP) utilizando CoreNLP de Stanford , y me pregunto cuáles son algunas de las formas estándar de almacenar datos analizados de NLP para algo así como una aplicación de minería de texto.
Una forma que pensé que podría ser interesante es almacenar a los niños como una lista de adyacencia y hacer un buen uso de las consultas recursivas (Postgres lo admite y he descubierto que funciona muy bien).
Pero supongo que probablemente haya muchas formas estándar de hacer esto, dependiendo del tipo de análisis que se haya realizado y que haya sido adoptado por personas que trabajan en el campo a lo largo de los años. Entonces, ¿cuáles son las estrategias de persistencia estándar para los datos analizados de PNL y cómo se usan?
fuente