¿Cuáles son los paquetes de minería de texto para R y existen otros programas de minería de texto de código abierto?

12

¿Me puede recomendar un paquete de minería de texto en R que pueda usarse en grandes volúmenes de datos?
En segundo lugar, ¿hay una GUI disponible para alguno de los paquetes de minería de texto en R?
En tercer lugar, ¿hay otro programa de minería de texto de código abierto que sea fácil e intuitivo de usar?


fuente
@mbq: bueno, "¿hay un paquete de minería de texto de código abierto con una GUI?" probablemente cubriría las tres preguntas bastante bien, ya es una pregunta ...
nada101

Respuestas:

4

Aquí hay otros dos proyectos integrados:

  • Python Natural Language Toolkit (instalación fácil, buena documentación)
  • Java MALLET (sin experiencia, pero parece prometedor; incluido en el enlace proporcionado por @Nick)

Ambos son software de código abierto.

chl
fuente
1

GATE es muy completo. También le permite trabajar con diferentes idiomas y tiene un editor de ontología.

Ralph Winters
fuente
0

Andrew McCallum (UMass) tiene algunos proyectos de software relacionados con la PNL disponibles en su página web . Todos estos están en Java (creo) con código fuente disponible.

Mella
fuente