¿Cómo convertir archivos .PDF y .doc / .docx a archivos .HTML?

3

¿Alguien sabe de algún software (preferiblemente de código abierto, Linux o PHP) que pueda convertir PDF y / o DOC / DOCX (y tal vez otros formatos de documentos también: rtf, txt, etc.) a HTML?

Tengo el software "PDFtoHTML" funcionando pero no parece que también convierta archivos DOC / DOCX.

Tim Peterson
fuente

Respuestas:

1

Deberías darle una vuelta a unoconv . Debería poder convertir cualquier cosa que Open Office pueda leer en cualquier cosa que pueda escribir.

Esto funciona en doc / docx y en muchos otros archivos. Parece que no funciona en PDF, así que supongo que está atascado con el uso de 2 programas separados para el trabajo.

jpjacobs
fuente
hola jpjacobs, gracias por el consejo, no había oído hablar de unoconv, lo intentaré, ¡gracias! -tim
1

Puse con éxito una versión portátil de libreoffice en el servidor web de mi host, que llamo con PHP para hacer una conversión de línea de comandos a .docx, etc. a pdf. sobre la marcha. No tengo derechos de administrador en el servidor web de mi host. Aquí está mi publicación de blog de lo que hice:

http://geekswithblogs.net/robertphyatt/archive/2011/11/19/converting-.docx-to-pdf-or-.doc-to-pdf-or-.doc.aspx

¡Hurra! ¡Convierta directamente de .docx o .odt a .pdf usando PHP con LibreOffice (el sucesor de OpenOffice)!

Robert Hyatt
fuente
0

¿Has probado PHPDocX ? Le permite hacer bastantes cosas más con los archivos docx.

Hay un método generateXHTML .

Eduardo
fuente
parece que PHPDocX crea archivos .docx pero estoy buscando un software que convierta archivos .docx a HTML. ¿Estoy confundido?
Tim Peterson