En Ubuntu 12.10, si escribo
gnome-screenshot -a | tesseract output
vuelve:
** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11.
¿Cómo puedo seleccionar un texto de la pantalla y convertirlo en texto (portapapeles o documento)?
¡Gracias!
gnome-screenshot -a
? ¿También por qué canaliza la salida a tesseract? Si no me equivoco, gnome-screenshot guarda la imagen en un archivo y no la "imprime" ...auto-save-directory
? ¿Y dejó caer algo allí? Enlace interesante: forums.debian.net/viewtopic.php?f=6&t=85683Respuestas:
Tal vez ya haya alguna herramienta que lo haga, pero también puede crear un script simple con alguna herramienta de captura de pantalla y tesseract, ya que está tratando de usar.
Tome como ejemplo este script (en mi sistema lo guardé como
/usr/local/bin/screen_ts
):Y con soporte para portapapeles:
Se utiliza
scrot
para tomar la pantalla,tesseract
reconocer el texto ycat
mostrar el resultado. La versión del portapapeles también utilizaxsel
para canalizar la salida en el portapapeles.NOTA :
scrot
,xsel
,imagemagick
ytesseract-ocr
no están instalados por defecto, pero están disponibles en los repositorios por defecto.Usted puede ser capaz de reemplazar
scrot
congnome-screenshot
, pero puede tomar un montón de trabajo. Con respecto a la salida, puede usar cualquier cosa que pueda leer un archivo de texto (abrir con el Editor de texto, mostrar el texto reconocido como una notificación, etc.).Versión GUI del script
Aquí hay una versión gráfica simple del script OCR que incluye un diálogo de selección de idioma:
Además de las dependencias enumeradas anteriormente, deberá instalar Zenity fork YAD desde el PPA webupd8 para que el script funcione.
fuente
rm $SCR_IMG.png $SCR_IMG.txt
).scrot
por sí solo no puede usar el portapapeles. Pero hay herramientas comoxclip
oxsel
que pueden hacer lo que necesita si es copiar / pegar texto.| clipboard
al final de la línea final del script de Salem.No sé si alguien necesita mi solución. Aquí hay uno que corre con wayland.
Muestra el reconocimiento de caracteres en un editor de texto y, si agrega el parámetro "sí", obtiene la traducción de la herramienta Goggle Trans (la conexión a Internet es obligatoria). Antes de poder usarla, instale tesseract-ocr imagemagick y google-trans. Inicie el script, es decir, en gnome con Alt + F2 cuando vea el texto que desea reconocer. Mueva el curso alrededor del texto. Eso es. Este script fue probado solo para gnome. Para otro administrador de ventanas, debe ser cómodo. Para traducir el texto a otros idiomas, reemplace la ID de idioma en la línea 25.
fuente
Acabo de hacer un blog sobre cómo usar la captura de pantalla en la actualidad. A pesar de que apunto al chino, la transmisión de pantalla y el código están en inglés. OCR es simplemente una de las características.
Característica para mi OCR:
Abrir en konsole + vimx O gedit para editar más.
Para vimx + inglés, habilite la revisión ortográfica.
Admite la selección dinámica de idiomas sin código duro.
Diálogo de progreso al convertir y probar que es lento.
Código de función:
Código de llamada:
Combine este código 2 en un script de shell único para ejecutar.
Captura de pantalla 1:
Captura de pantalla 2:
fuente
La idea es que cada vez que aparezcan nuevos archivos de captura de pantalla en la carpeta, ejecute tesseract OCR y se abra en un editor de archivos.
Puede dejar este script en ejecución en el directorio de salida de su directorio de salida de captura de pantalla favorito
Necesitará que esto se instale
fuente
Creé un programa gratuito y de código abierto para este propósito:
https://danpla.github.io/dpscreenocr/
fuente