Mi código:
import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
Mensaje de error:
[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load
opened_resource = _open(resource_url)
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open
return find(path_, path + ['']).open()
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find
raise LookupError(resource_not_found)
LookupError:
Resource u'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource:
>>>nltk.download()
Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''
Estoy tratando de ejecutar este programa en una máquina Unix:
Según el mensaje de error, inicié sesión en el shell de Python desde mi máquina Unix y luego utilicé los siguientes comandos:
import nltk
nltk.download()
y luego descargué todas las cosas disponibles usando las opciones d-down loader y l- list, pero el problema persiste.
Hice todo lo posible para encontrar la solución en Internet, pero obtuve la misma solución que hice como mencioné en los pasos anteriores.
Respuestas:
Para agregar a la respuesta de alvas , puede descargar solo el
punkt
corpus:Descargar
all
suena como una exageración para mí. A menos que eso sea lo que quieras.fuente
Si solo desea descargar el
punkt
modelo:Si no está seguro de qué datos / modelo necesita, puede instalar los populares conjuntos de datos, modelos y etiquetadores de NLTK:
Con el comando anterior, no es necesario utilizar la GUI para descargar los conjuntos de datos.
fuente
Tengo la solucion:
una vez que se inicia NLTK Downloader
d) Descargar l) Listar u) Actualizar c) Configurar h) Ayuda q) Salir
Descargador> d
¿Descargar qué paquete (l = lista; x = cancelar)? Identificador> punkt
fuente
Desde el shell puede ejecutar:
Si desea instalar los populares modelos / corpora NLTK:
Si desea instalar todos los corpora / modelos NLTK:
Para enumerar los recursos que ha descargado:
fuente
Abra el indicador de Python y ejecute las declaraciones anteriores.
La función sent_tokenize usa una instancia de PunktSentenceTokenizer del módulo nltk.tokenize.punkt . Esta instancia ya ha sido entrenada y funciona bien para muchos idiomas europeos. Entonces sabe qué puntuación y caracteres marcan el final de una oración y el comienzo de una nueva oración.
fuente
Lo mismo me pasó a mí recientemente, solo necesitas descargar el paquete "punkt" y debería funcionar.
Cuando ejecuta "list" (l) después de haber "descargado todas las cosas disponibles", ¿está todo marcado como la siguiente línea ?:
Si ve esta línea con la estrella, significa que la tiene y nltk debería poder cargarla.
fuente
Vaya a la consola de Python escribiendo
en tu terminal. Luego, escriba los siguientes 2 comandos en su shell de Python para instalar los paquetes respectivos:
Esto me resolvió el problema.
fuente
Mi problema fue que llamé
nltk.download('all')
como usuario root, pero el proceso que finalmente usó nltk fue otro usuario que no tenía acceso a / root / nltk_data donde se descargó el contenido.Así que simplemente copié de forma recursiva todo, desde la ubicación de descarga a una de las rutas donde NLTK buscaba encontrarlo así:
fuente
Ejecute el siguiente código:
Después de esto, aparecerá el descargador NLTK.
fuente
Recibí un error a pesar de importar lo siguiente,
pero para google colab esto resolvió mi problema.
fuente
El simple nltk.download () no resolverá este problema. Probé lo siguiente y funcionó para mí:
en la carpeta nltk, cree una carpeta de tokenizadores y copie su carpeta punkt en la carpeta de tokenizadores.
¡Esto funcionará! la estructura de la carpeta debe ser como se muestra en la imagen
fuente
Necesita reorganizar sus carpetas Mueva su
tokenizers
carpeta a lanltk_data
carpeta. Esto no funciona si tiene unanltk_data
carpeta que contiene lacorpora
carpeta que contiene latokenizers
carpetafuente
Para mí, nada de lo anterior funcionó, así que descargué todos los archivos a mano desde el sitio web http://www.nltk.org/nltk_data/ y los puse también a mano en un archivo "tokenizadores" dentro de "nltk_data". "carpeta. No es una solución bonita, pero sigue siendo una solución.
fuente
Después de agregar esta línea de código, se solucionará el problema:
fuente
Me enfrenté al mismo problema. Después de descargar todo, todavía estaba allí el error 'punkt'. Busqué el paquete en mi máquina con Windows en C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers y puedo ver 'punkt.zip' presente allí. Me di cuenta de que de alguna manera el zip no se ha extraído en C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers \ punk. Una vez que extraje el zip, funcionó como música.
fuente
Solo asegúrese de que está usando
Jupyter
Notebook y en una notebook, haga lo siguiente:Luego aparecerá una ventana emergente (que muestra información https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml ) Desde allí, debe descargar todo.
Luego, vuelva a ejecutar su código.
fuente
Para mí, se resolvió usando "nltk:"
http://www.nltk.org/howto/data.html
Error al cargar english.pickle con nltk.data.load
fuente