Cambio de nombre de un archivo pdf (documento escaneado) mediante OCR. Debe leer 3 zonas y cambiar el nombre en consecuencia. p.ej. Streetname_LastName_Date.pdf [cerrado]

1

Estoy teniendo problemas con toneladas de papeleo. Quiero digitalizarlo para simplificar la búsqueda y, por lo tanto, reducir una gran cantidad de tiempo dedicado a revisar el papeleo.

Es bastante simple, quiero escanear documentos, que comparten el mismo diseño y lo cambian de nombre de acuerdo con 3 áreas dentro del documento. En mi caso, es un número de referencia, un apellido y la fecha que figura en el documento. Sería aún mejor si pudiera mover los archivos a carpetas con el nombre de un área en el documento.

Aquí hay una imagen, básicamente esta pero con cientos de archivos PDF en lote.

image No pude encontrar ninguna solución durante días y, sin embargo, la tecnología está ahí. ¿Alguna vez te has topado con un problema como este y has encontrado una solución? Realmente agradecería su ayuda.

Lo más cercano que he encontrado es un programa llamado FileCenter, pero debe hacer clic en un botón para cada análisis. El uso de ocr en archivos existentes requiere que pase por un menú de 3 clics para cada archivo. Me pregunto si hay un programa por lotes fácil, donde solo seleccionas los rectángulos y hace la parte de cambio de nombre.

Editaré este OP si se puede encontrar alguna solución, para cualquiera que busque en Google.

someguywithaquest
fuente
Hay algunos sistemas de archivo de escáner, como el escáner Neat que solía publicitarse en TV, que tiene cierta inteligencia. Pueden hacer cosas como leer una tarjeta de negocios y averiguar qué trozos de texto van en cada campo de una libreta de direcciones, o leer una receta y descubrir los trabajos clave para organizarla. No sé qué tan "entrenables" son, pero vale la pena explorarlos.
fixer1234