Hay xpdf que incluye el pdftotextbinario.
Pdftotext convierte archivos de formato de documento portátil (PDF) a texto sin formato.
En Linux hay un instalador disponible. Parece que también viene en el poppler-utilspaquete. En OS X, puede instalarlo usando Homebrew (instale eso primero) y luego usar
brew install homebrew/x11/xpdf
que descargará los archivos fuente y lo compilará para OS X. Después de eso, simplemente úselo como:
pdftotext your_pdf_file.pdf
que generará un archivo de texto sin formato. También hay un par de opciones, echa un vistazo man pdftotextpara más detalles.
Una alternativa es poppler , en OSX:
brew install poppler
en Debian y amigos
apt-get install poppler-utils
brew install homebrew/x11/xpdfbrew install Caskroom/cask/pdftotextUna buena herramienta para Windows es A-PDF Text Extractor
fuente