Archivo de texto del diccionario [cerrado]

222

Estoy escribiendo un programa que necesita MUCHAS palabras del idioma inglés. Estoy tratando de encontrar un archivo de diccionario que tenga muchas palabras. ¿Alguien sabe de una buena fuente? Probé muchas fuentes pero no parecen tenerlo.

SuperString
fuente
3
@DWright No lo eliminé, lo cerré porque no está en el tema para las expectativas actuales de Stack Overflow. Está pidiendo explícitamente recomendaciones, enlaces que no están en el tema.
Taryn
Es cierto que había olvidado que En espera va a Cerrado, no se elimina.
DWright
Entonces, @bluefeet, perdón por mi comentario de 'protesta' que fue mal informado, su acción es correcta y no deduce valor.
DWright
15
¿Por que disculparse? Claramente tiene valor para la comunidad SO. Las "expectativas actuales" de SO claramente pierden el objetivo.
Andrew

Respuestas:

224

¿Qué pasa /usr/share/dict/wordscon cualquier sistema Unix? ¿De cuántas palabras estamos hablando? ¿Como OED-Unabridged?

Robert
fuente
20
Gracias ! ¡Más de 200000 palabras, muy apreciadas! cat /usr/share/dict/words > words.txttodas las cosas !
jokoon
77
Si le falta este archivo, puede instalarlo en Debian / Ubuntu escribiendosudo apt-get install wbritish
ataque aéreo
17
¿Alguien sabe por casualidad un lugar donde esto se puede descargar para sistemas que no son Unix?
Tom
2
@Tom Yeah, www.FreeBSD.org (instala FreeBSD en algún lugar y boom, lo tienes). De lo contrario, creo que esta lista es similar: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Greg Schmit
2
En caso de que no lo supieras: esto también funcionará en macOS :)
Lewis
44

Para un archivo .txt del diccionario de inglés, puede usar el Diccionario personalizado .

También puede generar una lista aspell o wordlist con configuraciones propias.

También puedes echar un vistazo a http://wordlist.sourceforge.net/

Solo palabras en inglés: http://www.math.sjsu.edu/~foster/dictionary.txt

Sujith PS
fuente
Si bien este enlace puede responder la pregunta, es mejor incluir aquí las partes esenciales de la respuesta y proporcionar el enlace como referencia. Las respuestas de solo enlace pueden dejar de ser válidas si la página vinculada cambia.
DeanOC
21
@DeanOC: Creo que es bastante claro que las "partes esenciales" de un diccionario serían todo el diccionario. Eso no es práctico para pegar aquí. También es bastante claro cuál es el uso: extraer palabras de él. Entonces, esto no es, de hecho, solo enlace. Es una respuesta de recomendación legítima sobre una pregunta que debería estar (y ahora está) cerrada.
Nathan Tuggy
@NathanTuggy Esta respuesta apareció en la cola de LQP, y creo que se ajusta a la definición de una respuesta de solo enlace. Como usuario <3K rep, mi voto para eliminar no hace nada más que ayudar a llamar la atención de alguien que puede hacerlo.
DeanOC
1
@DeanOC: Sé que apareció en LQP. Golpeé Looks OK, por las razones dadas: básicamente, que "solo enlace" es mucho más sutil que "¿tiene un enlace pero no tiene código o cita? QUEMAR CON FUEGO". Tenga en cuenta que suficiente Recomendar opciones de eliminación, incluso por 2k usuarios se borrar mensajes. (Yo personalmente he sido responsable de dejar caer una serie de publicaciones en el borde).
Nathan Tuggy
@NathanTuggy Usted es naturalmente libre de votar como mejor le parezca. He votado para eliminar ya que no veo ningún valor en esta respuesta si el enlace se vuelve obsoleto.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350,000 palabras

Muy tarde, pero puede ser útil para otros.

Rajendra Uppal
fuente
24
Mirando los primeros, muchos no son palabras regulares en inglés.
tripleee
8
esto fue inútil ya que le faltaban muchas palabras simples como pecado, en, ...
FernandoZ
77
Sí, y tiene palabras como "wwwwwww". Ni una palabra.
Jared Forsyth el
1
Cuidado, este enlace bloquea mi Firefox porque intenta cargar todo el archivo ahahahaha
Andrew
@ Andrew no se bloquea en Chrome 50.
Bogdan M.
11

También hay WordNet . Su formato de archivos de datos está bien documentado.
Lo utilicé para construir una biblioteca de diccionario incrustable para desarrolladores de iOS ( www.lexicontext.com ) y también en una de mis aplicaciones.

O yo
fuente
2
Bote. En caso de que alguien esté buscando palabras asignadas a sus partes del discurso, simplemente descargue el paquete principal de WordNet.
Andrew
10

@ Buscadores de futuro: puede usar aspell para hacer las verificaciones del diccionario, tiene enlaces en ruby ​​y python. Haría tu trabajo mucho más simple.

Khaja Minhajuddin
fuente