Herramienta de línea de comandos para buscar archivos docx

9

¿Existe una herramienta de línea de comandos para buscar texto en un archivo docx? Lo intenté grep, pero no funciona con docx a pesar de que funciona bien con archivos txt y xml. Primero podría convertir el docx a txt, pero preferiría una herramienta que funcione directamente en archivos docx. Necesito la herramienta para trabajar con Cygwin.

Edición de OP: más tarde descubrí que la forma más fácil de lograr el grep es convertir esos docx a txt y luego grep sobre ellos.

Gob00st
fuente
Respuesta de stackoverflow relacionada .
jw013
Me deshice de la parte de DOS, ya que está fuera de tema aquí
Michael Mrozek
Relacionado: ¿Indización de texto completo compatible con la línea de comandos?
Gilles 'SO- deja de ser malvado'

Respuestas:

3

Sé de varias herramientas de indexación que admiten documentos de Word. Dichas herramientas le permiten indexar documentos, luego buscar eficientemente palabras en el índice. No permiten búsquedas de texto completo.

Gilles 'SO- deja de ser malvado'
fuente
1

DOCx está comprimido y no es un formato de texto. Entonces, lo que necesita es un convertidor primero. Después de eso, puede usar el findcomando en los archivos convertidos.

Nils
fuente
O puede usar una herramienta de búsqueda que puede leer dentro de archivos comprimidos. En tu última oración, supongo que quisiste decir grep.
Gilles 'SO- deja de ser malvado'
@Gilles: mire el título original de la pregunta antes de que Michael la edite. Esto parecía ser una pregunta sobre DOS (y lo marqué fuera de tema).
Nils