Preguntas etiquetadas con nltk

Natural Language Toolkit es una biblioteca de Python para lingüística computacional.

137
n-gramos en pitón, cuatro, cinco, seis gramos?

Estoy buscando una manera de dividir un texto en n-gramas. Normalmente haría algo como: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Soy consciente de que nltk solo ofrece bigrams y trigrams, pero...

110
Cómo eliminar las palabras vacías usando nltk o python

Así que tengo un conjunto de datos que me gustaría eliminar el uso de palabras vacías stopwords.words('english') Estoy luchando por cómo usar esto dentro de mi código para simplemente eliminar estas palabras. Ya tengo una lista de las palabras de este conjunto de datos, la parte con la que estoy...

101
problema de pip al instalar casi cualquier biblioteca

Tengo dificultades para usar pip para instalar casi cualquier cosa. Soy nuevo en la codificación, así que pensé que tal vez esto es algo que he estado haciendo mal y he optado por easy_install para obtener la mayor parte de lo que necesitaba, que generalmente ha funcionado. Sin embargo, ahora estoy...

83
Creando un nuevo corpus con NLTK

Calculé que a menudo la respuesta a mi título es ir y leer la documentación, pero revisé el libro NLTK pero no da la respuesta. Soy un poco nuevo en Python. Tengo un montón de .txtarchivos y quiero poder usar las funciones de corpus que NLTK proporciona para el corpus nltk_data. Lo intenté...

8
Obteniendo "mal escape" cuando se usa nltk en py3

NLTK versión 3.4.5. Python 3.7.4. OSX versión 10.14.5. La actualización de la base de código de 2.7 comenzó a encontrarse con este problema en este momento. He realizado una nueva reinstalación sin caché de todos los paquetes y extensiones, en un nuevo virtualenv. Bastante desconcertado sobre cómo...