Por lo general, uso Notepad ++ para buscar en archivos utilizando expresiones regulares. Hoy me pregunto si hay un programa PDF que haga lo mismo para los PDF. Por supuesto, podría convertir el PDF a texto y usar Notepad ++, pero ¿hay alguna manera más fácil sin convertir?
15
Respuestas:
Varias opciones:
fuente
Tal como dijiste, la alternativa evidente es convertir archivos PDF a texto. Una forma para que un programador configure eso para el procesamiento masivo es usando el paquete PDFMiner de Python. Agent Ransack usa "pdftotext" del proyecto Xpdf (y usted también puede hacerlo).
fuente