¿Me puede recomendar un paquete de minería de texto en R que pueda usarse en grandes volúmenes de datos?
En segundo lugar, ¿hay una GUI disponible para alguno de los paquetes de minería de texto en R?
En tercer lugar, ¿hay otro programa de minería de texto de código abierto que sea fácil e intuitivo de usar?
12
Respuestas:
Consulte la Vista de tareas CRAN sobre Procesamiento de lenguaje natural que incluye, entre otros, el paquete tm ya mencionado por Josh.
fuente
Vea el paquete tm y esta presentación de Stefan Theussl en la conferencia R / Finance 2010 .
fuente
Aquí hay otros dos proyectos integrados:
Ambos son software de código abierto.
fuente
Claro, RapidMiner con la extensión de minería de texto.
Hay muchos videos que muestran cómo se hace.
fuente
GATE es muy completo. También le permite trabajar con diferentes idiomas y tiene un editor de ontología.
fuente
Andrew McCallum (UMass) tiene algunos proyectos de software relacionados con la PNL disponibles en su página web . Todos estos están en Java (creo) con código fuente disponible.
fuente
Además de la vista de tareas CRAN sobre procesamiento de lenguaje natural mencionada por Dirk, hay paquetes de quanteda y paquete de PNL .
fuente