¿Dónde puedo descargar la base de datos del diccionario de inglés en formato de texto? [cerrado]

127

Necesito leer el archivo de texto de una palabra y devolver su significado. Cualquier otro formato de archivo también funcionará.

Abhi
fuente
He escrito un web clawler para todos los diccionarios en línea famosos (Oxford, Longman, Cambridge, Webster y Collins). Puede usarlo para crear su datset. github.com/kiasar/Dictionary_crawler
Peyman

Respuestas:

62

El Proyecto Gutenberg alberga el Diccionario Inglés Completo Webster, además de muchas otras obras literarias de dominio público. En realidad, parece que tienen varias versiones del diccionario alojadas con derechos de autor de diferentes años. El que vinculé tiene un copyright de 2009. Es posible que desee hurgar en el sitio e investigar las diferentes versiones del diccionario Webster.

Asaph
fuente
1
'09 transcripción limpia de la versión de 1913, aparentemente el OCR no estaba completamente limpio. Hay un total de 15 versiones en el sitio.
DragonLord
57

user1247808 tiene un buen enlace con: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Si eso no son suficientes palabras para ti:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (URL actualizada de la sugerencia de Michael Kropat)

Aunque ese nombre de archivo cambia, querrás encontrar el último ... que resulta ser un archivo de texto grande (muy grande).

http://dumps.wikimedia.org/enwiktionary/

Orwellophile
fuente
gracias .. por este enlace
AndyBoy
Siempre puedes descargar el último wiktionary de dumps.wikimedia.org/enwiktionary/latest/…
Michael Kropat el
androidtech / wordnet20 está en formato SQL, no txt.
DragonLord
1
Tenga en cuenta: la sintaxis en wordnet20 tiene un TYPE = * en desuso en el archivo .sql. Ejecutar sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlpara reemplazar la sintaxis obsoleta antes de ejecutarla en una versión 5.0+ de MySQL
Serguei Fedorov
¿No hay un archivo txt simple que contenga todas las palabras en inglés?
Nadav B
27

No sé si es demasiado tarde, pero pensé que ayudaría a alguien más.

Quería lo mismo ... lo encontré eventualmente.

Quizás no sea perfecto, pero para mí es adecuado (para mi pequeña aplicación de diccionario).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

No es un archivo de volcado, sino un archivo de script MYSQL .sql

Las palabras están en la tabla WN_SYNSET y el glosario / significado en la tabla WN_GLOSS

usuario1247808
fuente
44
¿Con qué licencia está esto?
Cole Johnson
2
No estoy seguro también, pero en androidtech.com/html/downloads.php hayHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista
77
Usuarios de MySQL: las instrucciones de creación de tabla utilizan la opción TYPE ahora eliminada. Ejecute esto en el archivo sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlpara que funcione en la última versión de MySQL
anthonygore
15

Compruebe si estos recursos gratuitos se ajustan a sus necesidades.

mvark
fuente
8
FOLDOC (Free On-line Dictionary of Computing) parece ser un diccionario de términos / nombres informáticos únicamente. Puede ser útil para algunos, pero no es un diccionario de propósito general en el que pueda buscar la mayoría de las palabras.
Lèse majesté
2
El enlace de la página ObjectGraph también está muerto. Las versiones oficiales descargables se encuentran aquí .
Lèse majesté
@ Lèsemajesté su enlace también está muerto ahora
yukashima huksay