Cambio de formato de palabra

0

Estoy viendo algunos archivos de Word editados por un antiguo asistente. Con "mostrar todos los caracteres que no se imprimen" desactivado, se ve bien además de algunos cambios de fuente extraños. Activar "mostrar todos los caracteres que no se imprimen" muestra el formato que hace que se vea bien, pero claramente no es el formato escrito por una persona. Un ejemplo: el documento original tenía numeración de líneas cada cinco líneas. Esta versión parece que tiene numeración de líneas pero son solo caracteres. Tiene un salto de sección justo antes de cada 5ª línea. Para realizar una edición de tamaño modesto, lo exporto todo como texto y empiezo a colocar el formato. ¿Alguna idea de cómo podría pasar esto? ¿Podría esto venir de OCR a un PDF? ¿Alguna forma mágica de corregirlo?

George White
fuente

Respuestas:

1

Sí, ese tipo de formato suena como lo que puede suceder cuando su software OCR está configurado para interpretar lo que ha escaneado, cuando en realidad solo necesita el texto plano para aplicar los estilos.

Hace mucho tiempo, en un sistema Windows, tuvimos que recuperar un documento electrónico de la única copia impresa restante que teníamos. El software tenía una característica de marquesina, donde:

  1. Escanea la página y te muestra la vista previa
  2. Le permite dibujar recuadros rectangulares sobre las partes que le interesaron (esta fue una herramienta conveniente para ignorar fragmentos de escaneo)
  3. Producir campos de texto que contienen el texto escaneado.
  4. Proporcione un botón que copie el texto al Portapapeles

El tema de la copia al portapapeles, si hizo clic en el botón, se produjo una interpretación que introdujo un formato aceptable, pero ya no tenía texto sin formato.

Sin embargo, en el paso (3), si arrastra el texto dentro del campo del párrafo y lo selecciona a mano copiado al portapapeles, luego obtendrías texto plano, para lo cual era más fácil asignar estilos.

Con respecto al software de Mac, intente una demostración para el último Adobe Acrobat y vea si puede hacer un trabajo decente haciendo OCR en una captura de pantalla / escaneo de esos archivos de Word.

Vzzdak
fuente