He estado buscando en Google durante algún tiempo, pero no puedo encontrar una respuesta a mi pregunta.
Tengo capas no deseadas de OCR en un documento que escaneé recientemente con Adobe Acrobat. No se ha OCR correctamente, y quiero redactar alguna información, pero el OCR está haciendo que se borre la información deseada. Convertí los archivos a TIF, pero noté una pérdida de calidad (muy) significativa. He oído que imprimir en otro PDF mantiene el texto o reduce la calidad de la imagen.
Agradezco cualquier ayuda para resolver este problema lo antes posible.
Gracias.
fuente
Después de mucho experimentar, descubrí que imprimir en Adobe PDF desde Adobe Acrobat imprime el documento sin el OCR y sin perder la calidad (se pierde una resolución imperceptible a primera vista).
Sin embargo, muchos sitios afirman que esto no funciona. También probé con otras impresoras como Foxit Reader y OneNote, pero la calidad se redujo. JPEG también era lo mismo.
Tenga en cuenta que su kilometraje puede variar.
Nota: Dejo este hilo marcado como sin respuesta con la esperanza de encontrar una respuesta mejor que la mía.
fuente
(hace un año...)
Si, como usted dice, los documentos se escanean y no se imprimen en PDF desde Word, por ejemplo, puede eliminarlos fácilmente con su Adobe:
Seleccione Documento, Examinar documento y ahora puede eliminar el texto oculto (OCR).
fuente
En Acrobat Pro: use 'eliminar información oculta' (bajo 'protección'). Seleccionar todo, ejecutar, OCR se ha ido
fuente
En Acrobat X, bajo Protección, hay un botón Desinfectar documento que elimina TODO lo que se puede ver (incluida la capa de texto OCR), convirtiendo el documento en un mapa de bits plano.
fuente
Creé una herramienta para hacer este PDF Redactor gratuito . Si carga la imagen y simplemente hace clic en redactar, aplanará su pdf y eliminará el OCR. Si lo desea, también puede dibujar marcas de redacción en el documento.
fuente