¿Por qué Word 2010 crea archivos PDF tan grandes?

11

Solo he notado que mis documentos de Word 2010 (docx) que tienen una sola página e incluyen un simple gráfico vectorial WMF y un poco de texto tienen casi 1 MB de tamaño. El documento de Word tiene solo 50 kB y un archivo PDF creado con la impresora Bullzip PDF tiene aproximadamente el mismo tamaño. Entonces, ¿qué está escribiendo Microsoft en los otros 950 kB?

Actualización: a medida que recibo respuestas recientes que no se aplican, me gustaría ahorrarle el trabajo. El problema desapareció después de usar Windows 7 en lugar de XP (lo que hice hace más de un año). Algo no parece ser compatible con el sistema anterior, sospecho que es un subconjunto de fuentes más o menos. Además, no puedo probar sus sugerencias porque el problema ya no existe. Así que no puedo aceptar respuestas a esto.

ygoe
fuente
¿La salida coincide? Voy a adivinar que Word coincidiría con el formato PDF más cerca que Bullzip (por lo que nunca he oído hablar de él).
Ramhound
1
Esto solo comenzó a suceder después de las últimas actualizaciones de WORD2010. Tengo WORD2010 y Acro Reader 9.5, pero una computadora no recibió las últimas actualizaciones de WORD. Ese toma un archivo DOCX muy cargado con imágenes, y lo convierte DOWN de 4 MB a 3 MB, la otra computadora con actualizaciones recientes de WORD convierte DOCX de 4 MB a 18MB. No puedo usar un archivo tan grande. NO ACTUALICE SU PALABRA programas.
1
Parece que Word está exportando imágenes en formato de mapa de bits de muy alta resolución. Amplíe y compare los PDF generados por Word y Bullzip y compare la calidad
tumchaaditya
1
Oh querido, esto es viejo. Word 2010 comenzó a crear archivos PDF con un tamaño más razonable después de cambiar de Windows XP a Windows 7. Supongo que Windows 7 tiene alguna API de subconjunto de fuentes que Word usa que Windows XP no tiene, por lo que siempre incluyó la fuente completa, o algo así. .
Ygoe
1
Acabo de tener el mismo problema al usar Word 2013 en Windows 7 Pro de 64 bits: tengo un archivo Word 2013 (docx) de 14kB de SOLO texto lorem ipsum con formato predeterminado, Word produce un PDF de 90kB cuando PDFcreator genera un archivo PDF de 22kB. Y crece rápidamente, el mismo archivo con algo de formato (Título, encabezados 1 y 2), el archivo de Word de 15kB (sin imágenes) se convierte en un archivo de 230kB con el PDF guardado de Word como (usando la compresión máxima), aunque solo 30kB con PDFcreator. Mi problema es que PDFcreator no procesa los enlaces.
Thomas

Respuestas:

2

Esto sigue siendo un problema con Word 2016. Quizás no sea lo mismo que tenía el OP, pero sigue ahí: comience con un documento de 1 página de 20 KB, guarde como PDF, obtenga un PDF de 300 KB.

No puedo decir por qué Word hace esto, pero hay una manera fácil de minimizar estos archivos PDF: instale GhostScript , luego ejecute el siguiente comando:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

donde% 1 es el PDF de entrada y% 2 es el PDF de salida. Convierte ese PDF de 300 KB en un PDF de 40 KB. Todavía no es tan pequeño como CutePDF (que manejó aproximadamente 30 KB para el mismo documento) pero una gran mejora.

O simplemente omita este paso e imprima directamente en CutePDF.

RomanSt
fuente
1
Vea el comentario de Arjan sobre la respuesta de Jakke.
fijador1234
Respaldando la respuesta. En lugar de 670k, cutePDF creó un archivo de 170k.
szako
1

Muchas razones.

  1. Estilo XML
  2. Imágenes convertidas a base64, que es 33%más grande que la original
  3. Otras cosas como fuentes, etc.
  4. ¡Muchas cosas que aparentemente no hacen nada!
Nadie
fuente
1

Verifique la configuración de sus opciones en Word 2010. Es posible que le indique a Word que incruste una o varias fuentes enteras en su documento. Esto causa una hinchazón terrible de documentos, especialmente si está utilizando fuentes Unicode. Desmarque esa opción si está marcada y Word incrustará solo los caracteres que realmente se utilizan en su documento.

También debe tener en cuenta que * .docx es un formato de archivo comprimido que debe descomprimirse antes de que se pueda convertir a un archivo PDF que aumenta su tamaño.

Si esto no funciona para usted, hay varias herramientas de optimización de PDF disponibles a través de Adobe y Nuance.

Espero que esto ayude.

Ælfstangard
fuente
0

Pensamiento: Word está convirtiendo el gráfico vectorial en un mapa de bits o PNG y lo incrusta en el documento con compresión limitada o nula. Verifique la configuración de PDF y vea si puede ajustar eso.

Análisis: ¡Una forma de verificar eso es cambiar la extensión del archivo de Word a .ZIP y ver por sí mismo lo que Word está haciendo!

Joshua
fuente
2
No puede modificar la generación de PDF de Word en absoluto. Solo puede elegir entre calidad "normal" y "web", pero eso solo hace una diferencia de unos pocos KB. Tendré que verificar la conversión de vector a píxel, que debería ser visible en factores de zoom muy altos.
Ygoe
3
Extraño, cuando hago zoom en el documento PDF, veo texto y gráficos rasterizados por muy poco tiempo. Parece una captura de pantalla de la ventana de Word, que incluye texto suavizado ClearType en baja resolución. Después de ese momento, el contenido se reemplaza por dibujos vectoriales de alta resolución, para gráficos y texto. ¿Cómo puedo consultar el documento PDF para averiguar si hay una imagen oculta de píxeles en el interior que se pueda eliminar?
ygoe
Tampoco creo que esta sea la razón. He notado la misma hinchazón con documentos que no contienen imágenes.
HappyNomad
@LonelyPixel: Probablemente necesita algún tiempo para su lector de PDF para volver a representar el contenido sobre cómo ampliar ..
tumchaaditya
0

Esto se debe a que el formato del documento PDF contendrá estilos para (probablemente) cada carácter. Hice algo como esto pero en HTML y generó un archivo html de 20 KB como un archivo de 600 KB.

Damodar Dahal
fuente
0

Utilice software diseñado para un propósito específico. Word es bueno para crear documentos de Word y debido a que muchos otros trajes de software agregan la función, MS no puede dejarla de lado. Realmente no entiendo por qué elegirían dedicar mucho tiempo y esfuerzo a optimizar algo que a la mayoría de las personas ni siquiera les importa. Las personas que se preocupan, no usan Word para imprimir en PDF.

Debería considerar instalar una impresora PDF dedicada en su computadora y utilizar la función IMPRIMIR para crear un archivo PDF. Hay muchos paquetes gratuitos y comerciales disponibles que hacen un trabajo perfecto y mantienen su archivo PDF comprimido al mínimo.

Preguntar por qué exactamente Word crea archivos PDF tan grandes es algo que es mejor preguntar a los ingenieros de MS en sus foros ... solo ellos pueden decirlo. Aquí obtendrá muchas conjeturas sobre por qué la EM hace las cosas de la manera que lo hacen.

Jakke
fuente
1
Prefiero la funcionalidad de exportación de PDF incorporada, ya que conserva tablas de contenido clicables o URL incrustadas y similares. (Como tal, la exportación en OpenOffice es excelente). Algún software podría funcionar bien con las opciones de impresión de PDF si lo proporciona el sistema operativo . Al igual que algunos navegadores en OS X, funcionan perfectamente con la impresión de PDF incorporada .
Arjan