¿Cómo indexar un documento pdf?

11

Estoy leyendo un documento PDF en Ubuntu 11.04 usando el "Visor de documentos" predeterminado. El documento tiene más de 500 páginas y lleva un tiempo completar un "Buscar ..." para un texto en particular. ¿Hay alguna manera de indexar los documentos PDF en la plataforma mencionada anteriormente? Estoy buscando una funcionalidad incorporada en el lector mismo.

Praveen Sripati
fuente

Respuestas:

1

No estoy seguro de que ninguno de los lectores de PDF sea compatible con la indexación de texto, probablemente porque la indexación en sí misma sería bastante costosa y los archivos pdf se abrirían y cerrarían 'ad-hoc'

Sin embargo, he hecho algunas pruebas y puedo ver que Okular, el visor predeterminado de KDE, tiene una búsqueda mucho más rápida que evince (el visor predeterminado de Ubuntu). Es decir, a Okular le lleva tal vez un segundo escanear todo el documento de 500 páginas, mientras que evidentemente pasa ~ 5 segundos en la misma tarea.

Puede instalarlo escribiendo

sudo apt-get install okular 

(o simplemente búsquelo en el Centro de software )

si este es el primer programa de KDE en su máquina, requeriría la instalación de bastantes dependencias, pero puede valer la pena: encuentro que los programas de KDE generalmente son más capaces que sus contrapartes de Gnome ... Okular admite anotaciones en pdf, para ejemplo, que también es útil a veces.

Sergey
fuente
Sergey - Estoy usando gnome. Como mencionó, muchas dependencias de kde también necesitan ser instaladas. ¿Qué tan arriesgado es instalar las dependencias kde? No quiero meterme en la molestia de instalar todo el sistema operativo nuevamente. Gracias por la ayuda.
Praveen Sripati
Es casi tan arriesgado como cruzar una carretera: millones de personas hacen esto todos los días, pero bueno, hay una pequeña posibilidad de que algo salga mal, al igual que con la instalación de cualquier otro software. En realidad, creo que es totalmente normal tener los escritorios Gnome, KDE y XFCE instalados al mismo tiempo y cambiar entre ellos ...
Sergey
Gracias Sergey: Okular es genial, la función de anotaciones es realmente agradable.
Praveen Sripati
@PraveenSripati si le preocupan las dependencias de Okular, es posible que desee probar qpdfview. Por favor vea mi respuesta a continuación para más detalles.
Glutanimate
3

Tracker puede indexar sus documentos pdf. Es muy rápido y confiable.

Si aún no utiliza esta gran herramienta, puede configurarla para que solo indexe sus documentos pdf: Alt+ F2luego pegue, tracker-preferencesvaya a "Ubicaciones" y elija la carpeta de su pdf.

desgua
fuente
1

Visor de PDF alternativo


Visión general

Una alternativa muy ligera y rápida a Okular que no viene con ninguna de sus dependencias de KDE es qpdfview . Todavía está en beta, pero descubrí que es tan estable como sus grandes contrapartes. El rendimiento de búsqueda es fantástico y al menos a la par con Okular.

Instalación

Qpdfview aún no está disponible en los repositorios oficiales, pero se puede instalar fácilmente desde el PPA del desarrollador escribiendo:

sudo add-apt-repository ppa:b-eltzner/qpdfview && apt-get update
sudo apt-get install qpdfview

Indexación de PDF


Visión general

No pude encontrar una alternativa a las capacidades de indexación de Adobe Acrobat en Linux y parece que es porque los índices incrustados todavía no son parte de los estándares abiertos de PDF .

Sin embargo, hay varios motores de búsqueda de escritorio muy potentes que son más rápidos y más eficientes en la indexación de PDF que las herramientas propietarias de Adobe. Ya se ha mencionado el rastreador, pero también hay otras aplicaciones. Puede encontrar una comparación muy completa aquí .

Glutanimato
fuente