Buscar texto en múltiples archivos PDF y documentos

36

Recibí un montón de notas escritas por otros estudiantes, pero son de un antiguo libro de texto que no se ocupó de todo en el mismo orden, por lo que necesito buscar en las notas de cada capítulo (cada capítulo individual es diferente. pdf o .doc) para "acondicionamiento de trazas", por ejemplo.

Solía ​​usar Google Desktop para esto, ahora tengo Launchy y le dije que buscara archivos PDF, pero solo busca los títulos, no el contenido.

Gracias por cualquier ayuda.

Conejo
fuente
Una vez que encuentre una coincidencia, ¿qué está tratando de hacer?
cremefraiche
¿Necesita saber si se produce una cadena en un archivo o dónde está también?
Jacob Vlijm
Una vez que encuentre qué capítulo cubre el tema que estoy buscando, puedo leer las notas sobre ese tema en ese capítulo, así que solo necesito saber SI y no dónde. (Recuerde al responder que no puedo comentar sus respuestas porque no tengo 50 puntos de reputación, solo puedo comentar mi propia pregunta).
Conejo
1
Puede comentar sobre respuestas a su pregunta, no estamos que dura.
Alaa Ali
@Rabbit con su resumen de edición, me bloqueó para que editara su pregunta para eliminar "Gracias";)
αғsнιη

Respuestas:

31

Recoll es probablemente el motor de búsqueda de documentos más versátil que encontrarás en Linux:

ingrese la descripción de la imagen aquí

Es compatible con una gran cantidad de formatos diferentes y es muy personalizable.

Para obtener instrucciones de instalación y otros consejos, consulte esta respuesta . La documentación oficial también es muy útil.

Glutanimato
fuente
44
Al aceptar esta respuesta porque es nativa de Linux, está en el centro de software de Ubuntu y es todo GUI. En otras palabras, esta es la más fácil: D Gracias :)
Rabbit
1
Aplicación increíble. ¡Tan rapido!
yuranos87
2
No olvides instalar antiwordpara buscar .docarchivos también.
lenooh el
22

Instala el paquete pdfgrep

sudo apt-get install pdfgrep

luego usa el comando:

find /path -iname '*.pdf' -exec pdfgrep pattern {} +
Edward Torvalds
fuente
¿Podemos configurarlo con el motor de búsqueda gnome?
Un Umar Mukthar
¡Gracias! Esto funcionó. Si alguien se pregunta, "patrón" es lo que reemplazaría con un texto específico. Si el texto tiene espacios, puede encerrarlo entre comillas dobles.
6005
2
Si sabe dónde están sus archivos PDF, puede simplificar el comando justo pdfgrep -r "my expression"donde -rbusca de forma recursiva a través de directorios.
LondonRob
4

Use DocFetcher , es una aplicación nativa de Linux que indexa y busca a través de múltiples tipos de documentos.

castaño
fuente
1
¡Gracias! Eso funciona bien, aunque parece que no puede ejecutarlo sin usar el terminal. Te votaría pero ... todavía no puedo votar;)
Conejo
@ Rabit Um, creo que también puedes votar las respuestas a tu pregunta.
Alaa Ali
@AlaaAli No, el límite de reputación también se aplica al OP.
Glutanimate
1
Sí, no pude. Aunque ahora puedo! :) Solo necesitaba 15
Rabbit
0

Entiendo que Adobe Reader es un software patentado, pero tiene una funcionalidad bien diseñada Buscar en archivos (accesible desde Editar -> Menú Buscar o presionando Ctrl+ Shift+ F).

Opciones de búsqueda simple

La ventana de búsqueda simple se muestra a continuación:

Búsqueda simple en Adobe Reader

Necesita establecer ¿Dónde le gustaría buscar? a Todos los documentos PDF en y luego seleccione la ubicación del menú desplegable ( Buscar ubicación ).

Puede ingresar el elemento de búsqueda a ¿Qué palabra o frase le gustaría buscar? campo y especifique las opciones de búsqueda: solo palabras completas , mayúsculas y minúsculas , incluir marcadores , incluir comentarios .

Opciones de búsqueda avanzada

La búsqueda avanzada es más configurable; vea la imagen a continuación:

Búsqueda Avanzada

La ruta de búsqueda se establece en Buscar en .
Buscar elemento: en ¿Qué palabra o frase le gustaría buscar? .
Los resultados de retorno que contienen tienen opciones: Coincidir con la palabra o frase exacta , Coincidir con cualquiera de las palabras , Coincidir con todas las palabras , Consulta booleana .

Otras opciones incluyen: palabras completas , mayúsculas y minúsculas , proximidad , derivación , incluir marcadores , incluir comentarios , incluir archivos adjuntos .


Nota: aún puede instalar Adobe Reader versión 9.5.5 nativa como se describe en otro hilo .

N0rbert
fuente
-5
  1. descarga primero el software "wine" en tu escritorio
  2. En este triunfo, instale seekfast como enlace a continuación
  3. http://seekfast.org/download-seekfast
  4. puedes hacer tu trabajo
  5. está funcionando, si no es así, por favor comenteme
Virbhadrasinh Gohil
fuente
1
Votaron a favor de sugerir vino (que significa Windows), cuando existen soluciones de Linux.
Sri
1
lo siento hermano, pero cuando lo necesito esa vez lo uso, por eso da esa sugerencia.
Virbhadrasinh Gohil
Generalmente no se sugiere ejecutar la aplicación de Windows en ubuntu Como Linux está prácticamente libre de virus. Voy con la idea de @Sri
un Umar Mukthar