Hay xpdf que incluye el pdftotext
binario.
Pdftotext convierte archivos de formato de documento portátil (PDF) a texto sin formato.
En Linux hay un instalador disponible. Parece que también viene en el poppler-utils
paquete. En OS X, puede instalarlo usando Homebrew (instale eso primero) y luego usar
brew install homebrew/x11/xpdf
que descargará los archivos fuente y lo compilará para OS X. Después de eso, simplemente úselo como:
pdftotext your_pdf_file.pdf
que generará un archivo de texto sin formato. También hay un par de opciones, echa un vistazo man pdftotext
para más detalles.
Una alternativa es poppler , en OSX:
brew install poppler
en Debian y amigos
apt-get install poppler-utils
brew install homebrew/x11/xpdf
brew install Caskroom/cask/pdftotext
Una buena herramienta para Windows es A-PDF Text Extractor
fuente