¿Alguien sabe de algún software (preferiblemente de código abierto, Linux o PHP) que pueda convertir PDF y / o DOC / DOCX (y tal vez otros formatos de documentos también: rtf, txt, etc.) a HTML?
Tengo el software "PDFtoHTML" funcionando pero no parece que también convierta archivos DOC / DOCX.
php
linux
file-conversion
Tim Peterson
fuente
fuente
Puse con éxito una versión portátil de libreoffice en el servidor web de mi host, que llamo con PHP para hacer una conversión de línea de comandos a .docx, etc. a pdf. sobre la marcha. No tengo derechos de administrador en el servidor web de mi host. Aquí está mi publicación de blog de lo que hice:
http://geekswithblogs.net/robertphyatt/archive/2011/11/19/converting-.docx-to-pdf-or-.doc-to-pdf-or-.doc.aspx
¡Hurra! ¡Convierta directamente de .docx o .odt a .pdf usando PHP con LibreOffice (el sucesor de OpenOffice)!
fuente
¿Has probado PHPDocX ? Le permite hacer bastantes cosas más con los archivos docx.
Hay un método generateXHTML .
fuente