Quiero convertir un .pdf
archivo en un .odt
archivo para poder convertirlo aún más en un .doc
archivo. ¿Hay algún software / script que pueda hacer esto? Intenté copiar el contenido del .pdf
archivo y lo pegué en liberoffice writer; el formato no se conserva.
El documento es confidencial, por lo que preferiría no utilizar ningún servicio en línea para la conversión.
Cualquier ayuda es muy apreciada.
format-conversion
ankit
fuente
fuente
Respuestas:
También me molestó la falta de un convertidor de PDF a ODT gratuito. Ni siquiera necesitaba nada complicado. Solo una herramienta que genera archivos ODT que luego puedo anotar en LibreOffice (por ejemplo, para completar formularios).
Sé cómo hacerlo manualmente, convirtiendo el documento PDF en archivos gráficos y luego importándolos a LibreOffice, pero eso se vuelve tedioso bastante rápido.
Entonces, finalmente escribí un pequeño script de shell que realiza todos los pasos necesarios automáticamente. Puede encontrarlo en https://github.com/gutschke/pdf2odt
Puede tomar cualquier cantidad de archivos PDF e imágenes como entrada y genera un archivo ODT que se puede abrir y editar en LibreOffice. Las imágenes aparecen como fondo de la página, por lo que puede escribir sobre ellas libremente. Cada imagen está asociada con su propio estilo de página. Tenga esto en cuenta al insertar saltos de página y ajuste el estilo de página según sea necesario.
Probé el script en Linux y Mac. Dado que solo necesita un puñado de herramientas razonablemente estándar, debería ser bastante portátil.
fuente
pdf2oo
hace unos años, pero parece que ahora produce archivos corruptos para LibreOffice. Este script hace eso y más, ¡gracias!Puede echar un vistazo a
PDF Utilities
(poppler-utils a través de Synaptic o apt-get) que incluye pdftotext :Por supuesto, el éxito dependerá de cómo se generó el archivo pdf. Si se obtiene lo que desea como un archivo de texto, que podría entonces excepto que como un archivo .odt.
Editar: Olvidé proporcionar la fuente de la cotización. Es de la pestaña de descripción en Synaptic para
PDF Utilities (based on Poppler).
fuente
pdftohtml
debe ser la mejor opción para la tarea, porque HTML puede llevar el formato. Entonces HTML podría convertirse a ODT o DOC.LibreOffice es capaz de importar
.pdf
archivos. Simplemente ábralo en una versión actual de LibreOffice para obtener mejores resultados. Sin embargo, abrirá el documento como un dibujo y podrá convertirlo solo a uno de los formatos de imagen admitidos, no como un documento de Writer.Naturalmente, no se conserva todo el formato, pero al menos algunos.
fuente
Si el paquete poppler-utils está instalado, la secuencia de comandos de Nautilus a continuación (que se colocará en la carpeta ~ / .gnome2 / nautilus-scripts como un archivo ejecutable) ayudará a convertir el archivo PDF a HTML (la opción "-i" se puede eliminar para incluir imágenes también), que luego se pueden abrir con LibreOffice Writer y guardar como ODT, aunque el éxito de la conversión de formato depende en gran medida de cómo se crea el PDF.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
fuente
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Entonces-noframes
no tendrá ningún efecto con-c
set.Prueba Calibre. Se convierte a html y luego a otros formatos. Hizo un trabajo bastante bueno en un archivo grande (183 páginas) que de otro modo habría tenido que imprimir.
En mi caso, lo convertí en un epub, pero por diversión lo convertí en un .docx que resultó muy bien.
fuente