Me gustaría escanear una buena cantidad de papeles que tengo por ahí, con la menor molestia posible. Me gustaría convertirlos a imágenes usando Simple Scan, luego convertirlos a texto usando OCR. ¿Existe una buena aplicación de OCR con una GUI que me dará buenos resultados con solo presionar un botón?
78
Respuestas:
GOCR from es un programa de reconocimiento óptico de caracteres (OCR) que convierte imágenes escaneadas de texto en archivos de texto.
CLARA es otra buena opción gráfica.
OCRAD from es un OCR que se puede usar como una aplicación de consola independiente o como un back-end para otros programas.
KOOKA from es una aplicación de KDE pero funciona bien, además tiene que instalar programas de OCR reales como GOCR y OCRAD. Después de instalar Kooka y los programas de OCR, debe apuntar a Kooka a la ubicación de instalación de OCR para que pueda Convierte el JPEG a texto.
OCRFeeder de es un sistema de análisis de diseño de documentos y reconocimiento óptico de caracteres.
Tesseract partir es la utilidad de línea de comandos y es muy sencillo de use.You puede instalar el paquete de idiomas tesseract-ocr-spa desde aquí .
Echa un vistazo a esta página .
Nota:
Para ejecutar tesseract goto terminal y escriba lo siguiente
Tesseract solo puede leer un archivo TIFF; si tiene un archivo JPEG o PDF o lo que sea, tendrá que convertirlo. Además, la extensión del nombre de archivo debe ser .tif, no .tiff, de lo contrario, se eliminarán los errores de prueba.
fuente
tesseract
(3.04.00 en Ubuntu 15.10) no tiene problemas conPNG
los archivos de entrada. aceptaJPG
archivos, pero da un resultado peor para ellos, como cabría esperar de los artefactos adicionales de compresión.Hay algunas herramientas populares de línea de comandos de OCR que puede usar (no estoy seguro si tienen GUI):
Tesseract ( Léame , preguntas frecuentes ) (Python)
También disponible para: Tesseract .NET , Tesseract iOS
Uso:
GOCR
OCRopus ™ ( FAQ ) (escrito en Python, NumPy y SciPy)
Tessnet2 (código abierto, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Pocos otros: ABBYY CLI OCR para Linux , Asprise OCR
Para obtener una lista más completa, consulte: Lista de software de reconocimiento óptico de caracteres en Wikipedia
Vea también:
wanghaisheng/awesome-ocr
- Una lista seleccionada de recursos prometedores de OCR en GitHub.fuente
linux-intelligent-ocr-solution
descargo de responsabilidad: estoy estrechamente relacionado con el desarrollo de esta solución de código abierto
Lios puede convertir la impresión a texto usando un escáner o una cámara.
También puede producir texto a partir de imágenes escaneadas de otras fuentes, como Pdf, Imagen o Carpeta que contiene imágenes.
El programa tiene accesibilidad total para personas con discapacidad visual.
Como estoy estrechamente conectado, me encantaría recibir comentarios.
fuente
Gscan2PDF
OCR en PDF de varias páginas o documentos escaneados
Esta es probablemente la forma más fácil. Gscan2pdf es una herramienta gráfica que le permite no solo escanear archivos, sino también importar archivos y realizar OCR en ellos. Instale gscan2pdf desde aquí , desde el Centro de software de Ubuntu o ejecute este comando en una terminal:
Gscan2PDF puede usar motores OCR personalizables, el valor predeterminado es
tesseract-ocr
Puede considerar seleccionar el idioma apropiado. En ese caso, deberá instalar el
tesseract-ocr-LANG
paquete, donde seLANG
encuentra el código de idioma ISO 639-2 de tres letras. En este momento tienes 108 idiomas en 16.04 repo.fuente
Acabo de tener éxito (bajo 16.04) con pdfocr.rb . Esto aparece en la wiki de Ubuntu
Aquí hay un ppa pero el repositorio para 16.04 no está actualizado. El script de rubí anterior de github, aunque todavía funciona con 16.04.
Puedes descargarlo desde Github. Necesitará los siguientes paquetes instalados:
luego hizo pdfocr.rb ejecutable y ejecutó:
Opcionalmente puede usar el
-l LANG
parámetro. En ese caso, deberá instalar eltesseract-ocr-LANG
paquete, donde seLANG
encuentra el código de idioma ISO 639-2 de tres letras. En este momento tienes 108 idiomas en 16.04 repo.fuente
La mejor y más fácil forma de usarlo
pypdfocr
es que no cambia el pdf. pypdfocr es un enlace del módulo de Python aquí.Al final, tendrá otro de
your_document_ocr.pdf
la forma que lo desee con texto de búsqueda. La aplicación no cambia la calidad de la imagen. Aumenta un poco el tamaño del archivo al agregar el texto superpuesto.Creo que el comando es bastante fácil ya que no necesita ninguna GUI. Quizás instalar pypdfocr sea un poco más detallado:
Actualización 3 de noviembre de 2018:
pypdfocr
ya no es compatible desde 2016 y noté algunos problemas debido a que no se mentained.ocrmypdf
(el módulo hace un trabajo similar y se puede usar así:Instalar:
o
fuente
Solo porque funciona muy bien y definitivamente debería estar en la lista:
Ejemplo de gimageReader de una captura de pantalla:
Está en los repositorios (respondido el 18.10, pero lo he estado usando durante años)
fuente
eng
como una opción ... pero lo resolví! :) Corrersudo apt install tesseract-ocr-eng
en la terminal hizo el truco. Sería bueno si esto se documentara en el archivo de ayuda de gimageReader o "README" en github ... o en alguna parte. Como aquí, tal vez.gscan2pdf incluye 3 motores ocr diferentes. Puede escanear directamente al programa o importar su pdf al programa. He descubierto que el motor Tesseract funciona muy bien y es muy fácil de usar.
fuente