Creé un documento simple de MS Word que contiene solo esta oración:
Este es un documento pequeño.
Nada más. Luego guardé este documento como DOCX y PDF. Aquí están los tamaños de archivo:
DOCX: 12 kB
PDF: 89 kB
Esta diferencia es enorme , técnicamente, y realmente comienza a molestarme cuando la mayoría de los documentos de texto que son decenas de kB en DOCX comienzan a generar archivos PDF de cientos de kB de gran tamaño. ¿Qué tiene de ineficiente el formato PDF? ¿O solo Word está usando un algoritmo de salida terrible?
Por cierto, la configuración de salida de PDF se estableció para crear el archivo más pequeño posible:
microsoft-word
pdf
docx
Borek Bernard
fuente
fuente
Respuestas:
Si abre el PDF en notepad ++, encontrará:
y ese objeto se hace referencia aquí al final en la instrucción / FontFile2:
Las fuentes utilizadas por el documento de Word se incrustan en el PDF, por lo que el pdf es autónomo.
Utilicé este mazo de diapositivas para descifrar las instrucciones en PDF.
Si desea evitar que las fuentes se incrusten en el archivo PDF, asegúrese de que su documento de Word utilice uno de los 14 tipos de letra estándar disponibles en los visores de PDF (fuente Wikipedia )
fuente
Esto me ha sucedido muchas veces en Microsoft Word al intentar exportar un manuscrito simple a PDF. Un documento de Word de 5–8 páginas, ~ 50 KB de tamaño, terminará como un archivo PDF de más de 10 MB, que es demasiado grande para enviarlo por correo electrónico razonablemente a alguien.
La respuesta de Rene está en el camino correcto: el problema es que las fuentes se incrustan en el documento, pero el solo uso de uno de los tipos de letra estándar no necesariamente resolverá el problema.
Todos mis documentos estaban en Times New Roman, usando nada más elegante que negrita y cursiva. O eso pensé. Resulta que tengo el kerning automático habilitado en mi plantilla predeterminada (por razones obvias ). Al exportar a PDF, Word en realidad estaba incorporando cada una de esas ligaduras como un objeto de fuente separado en el documento, hinchándolo más allá de toda creencia.
La solución es simple, solo debes recordar hacerlo cada vez:
Curiosamente, puede dejar ligaduras, alternativas contextuales y otras características avanzadas de tipografía habilitadas; no tienen ningún efecto perceptible en el tamaño del PDF resultante.
Vuelva a exportar el documento como PDF, y se reduce a un centenar de KB. Desafortunadamente, el interletraje es deficiente, por lo que no recomendaría imprimir de esta manera, pero funciona bien para enviar un documento por correo electrónico.
fuente
Para dar una respuesta menos técnica que pueda ayudar es que los PDF usan vectores (es decir, ecuaciones matemáticas) para describir todo lo que ves. Todas las curvas y líneas están definidas por ecuaciones matemáticas, por lo que necesariamente habrá mucha información para contener, especialmente cuando tenga imágenes en sus documentos.
El beneficio de esto es que teóricamente puede acercarse infinitamente sin perder resolución o detalle, ya que las líneas y curvas no tienen ancho, por lo que pueden escalar con su zoom.
Al igual que el cambio de fuente reciente de Google redujo el tamaño del logotipo de ~ 14KB a ~ 300B, las fuentes más simples probablemente ayudarán a reducir el tamaño de su archivo.
fuente