Estoy escribiendo un programa que necesita MUCHAS palabras del idioma inglés. Estoy tratando de encontrar un archivo de diccionario que tenga muchas palabras. ¿Alguien sabe de una buena fuente? Probé muchas fuentes pero no parecen tenerlo.
dictionary
SuperString
fuente
fuente
Respuestas:
¿Qué pasa
/usr/share/dict/words
con cualquier sistema Unix? ¿De cuántas palabras estamos hablando? ¿Como OED-Unabridged?fuente
cat /usr/share/dict/words > words.txt
todas las cosas !sudo apt-get install wbritish
Para un archivo .txt del diccionario de inglés, puede usar el Diccionario personalizado .
También puede generar una lista aspell o wordlist con configuraciones propias.
También puedes echar un vistazo a http://wordlist.sourceforge.net/
Solo palabras en inglés: http://www.math.sjsu.edu/~foster/dictionary.txt
fuente
También eche un vistazo a:
fuente
95 (insane)
3 (seldom used)
Strip
da alrededor de 675K palabras.http://www.math.sjsu.edu/~foster/dictionary.txt
350,000 palabras
Muy tarde, pero puede ser útil para otros.
fuente
También hay WordNet . Su formato de archivos de datos está bien documentado.
Lo utilicé para construir una biblioteca de diccionario incrustable para desarrolladores de iOS ( www.lexicontext.com ) y también en una de mis aplicaciones.
fuente
@ Buscadores de futuro: puede usar aspell para hacer las verificaciones del diccionario, tiene enlaces en ruby y python. Haría tu trabajo mucho más simple.
fuente