Abrir PDF en Illustrator divide los objetos de texto

10

Recientemente tuve que convertir algunos PDFarchivos SVGe hice esto abriendo el PDF en Illustrator y guardando en SVG.

El problema era que cuando Illustrator abría el pdf, muchos (pero no todos) los objetos de texto se dividirían en diferentes objetos de texto. Por ejemplo, la palabra "política" no sería un objeto de texto, sino varios objetos de texto, "po", "l", "helado". No parecía haber ninguna rima o razón para ello.

¿Cómo puedo evitar que esto suceda?

itsmikem
fuente

Respuestas:

11

Generalmente esto sucede para mantener la apariencia .

Si el texto interactúa con otros objetos, puede romperse. Si la fuente incrustada en el PDF es un subconjunto, en lugar de la fuente completa, se puede dividir en AI para que AI pueda insertar los caracteres que faltan del subconjunto.

Hay poco que puede hacer para evitar que esto suceda aparte de trabajar y guardar en la misma versión de Illustrator cada vez. Y solo guarda un PDF como un archivo separado para la salida, no la edición.


Pero se puede corregir en Illustrator mediante la selección de las cadenas de texto con la herramienta de selección directa o herramienta de selección , Edit > Copyy luego iniciar un nuevo punto o área de texto y Edit > Paste. El texto pegado será una cadena en lugar de las piezas que se copiaron.

Scott
fuente
55
gatos santos, quiero +10 esta respuesta solo para esa solución. Illustrator me ha estado volviendo loco con esto durante AÑOS.
Lauren-Clear-Monica-Ipsum
1
@LaurenIpsum ¿Viste la respuesta debajo de esto? Aún más sorprendente, de verdad.
Chris K
8

Si desea fusionar texto roto mientras conserva la mayor cantidad posible de formato, ubicación, párrafos y otra tipografía del texto existente, en lugar de pegar en un área de texto recién creada como texto plano, puede probar John Wundes ' increíble guión de unirse a marcos de texto .

Hace exactamente lo que dice en la lata: fusiona fragmentos de texto en un fragmento de texto, haciendo juicios inteligentes basados ​​en dónde se relacionan entre sí:

  • Fusiona fragmentos de texto adyacentes (por ejemplo, de líneas discontinuas de texto de archivos PDF) en líneas individuales, con cierto control ofrecido sobre qué tan cerca se considera la misma línea.
  • Fusiona líneas de texto separadas en un objeto de texto de varias líneas con el texto en el orden correcto (de arriba a abajo), arreglando párrafos rotos.
  • Luego hay una opción para restaurar el formato original de todo el texto combinado. Esto puede llevar un tiempo, pero de manera útil le brinda estimaciones bastante precisas de cuánto tiempo llevará y la opción de omitir si no vale la pena.

¡Es muy bueno!


Tenga en cuenta que solo funciona en texto de punto, no en texto de área (bien aquí, ya que los PDF casi siempre son texto de punto). Si está intentando fusionar texto de área por cualquier motivo, puede convertirlo con el script 'Hacer punto de texto' de Kelso Cartography


También es útil usado en conjunción con AjarProductions' Convertir a Área de texto guión (Kelso Cartografía también tienen un guión semejante, ver enlace anterior), si desea volver atrás en el texto roto en las áreas de texto adecuados con los párrafos de auto-fluye:

  1. Seleccione los fragmentos de texto rotos, ejecute el script Unir marcos de texto
  2. Copie y pegue el texto en un editor de texto que le permite buscar / reemplazar caracteres de párrafo (por ejemplo, InDesign, el editor de texto sin formato de un codificador, o tal vez incluso algo como ( susurros ) Word ...)
  3. Encuentra / reemplaza los saltos de final de línea no deseados. Si hay muchos párrafos separados que desea conservar, 1) ¿está seguro de que no sería mejor usar InDesign? 2) podrías hacerlo así:

    1. Busque / reemplace dos marcadores de párrafo consecutivos con algún marcador de posición de texto que no aparece en ningún otro lugar del texto (p \|\C.L.O.W.N.H.O.R.R.O.R/|/. Ej. )
    2. Buscar / reemplazar marcadores de párrafo con nada o espacios: convirtiéndolo en una larga línea de texto con ráfagas ocasionales de \|\C.L.O.W.N.H.O.R.R.O.R/|/
    3. Buscar / reemplazar \|\C.L.O.W.N.H.O.R.R.O.R/|/un nuevo carácter de párrafo, que coloca un párrafo dondequiera que estuvieran dos.
  4. Vuelva a copiar el texto y ejecute el script Convertir a área de texto en él. Ahora es un área de texto fluido con saltos de párrafo en los lugares correctos.


Desafortunadamente, nada puede arreglar el texto resumido, excepto evitar que se describa, volver a escribirlo o confiar en un software de OCR potencialmente dudoso.

user56reinstatemonica8
fuente
Tu respuesta es fantástica. Cité y volví a publicar la primera parte de su respuesta a este control de calidad: graphicdesign.stackexchange.com/a/105785/19447
Chris K