Recientemente tuve que convertir algunos PDF
archivos SVG
e hice esto abriendo el PDF en Illustrator y guardando en SVG.
El problema era que cuando Illustrator abría el pdf, muchos (pero no todos) los objetos de texto se dividirían en diferentes objetos de texto. Por ejemplo, la palabra "política" no sería un objeto de texto, sino varios objetos de texto, "po", "l", "helado". No parecía haber ninguna rima o razón para ello.
¿Cómo puedo evitar que esto suceda?
fuente
Si desea fusionar texto roto mientras conserva la mayor cantidad posible de formato, ubicación, párrafos y otra tipografía del texto existente, en lugar de pegar en un área de texto recién creada como texto plano, puede probar John Wundes ' increíble guión de unirse a marcos de texto .
Hace exactamente lo que dice en la lata: fusiona fragmentos de texto en un fragmento de texto, haciendo juicios inteligentes basados en dónde se relacionan entre sí:
¡Es muy bueno!
Tenga en cuenta que solo funciona en texto de punto, no en texto de área (bien aquí, ya que los PDF casi siempre son texto de punto). Si está intentando fusionar texto de área por cualquier motivo, puede convertirlo con el script 'Hacer punto de texto' de Kelso Cartography
También es útil usado en conjunción con AjarProductions' Convertir a Área de texto guión (Kelso Cartografía también tienen un guión semejante, ver enlace anterior), si desea volver atrás en el texto roto en las áreas de texto adecuados con los párrafos de auto-fluye:
Encuentra / reemplaza los saltos de final de línea no deseados. Si hay muchos párrafos separados que desea conservar, 1) ¿está seguro de que no sería mejor usar InDesign? 2) podrías hacerlo así:
\|\C.L.O.W.N.H.O.R.R.O.R/|/
. Ej. )\|\C.L.O.W.N.H.O.R.R.O.R/|/
\|\C.L.O.W.N.H.O.R.R.O.R/|/
un nuevo carácter de párrafo, que coloca un párrafo dondequiera que estuvieran dos.Vuelva a copiar el texto y ejecute el script Convertir a área de texto en él. Ahora es un área de texto fluido con saltos de párrafo en los lugares correctos.
Desafortunadamente, nada puede arreglar el texto resumido, excepto evitar que se describa, volver a escribirlo o confiar en un software de OCR potencialmente dudoso.
fuente