Convierta documentos de Microsoft Word (.doc / x) en archivos HTML

8

¿Alguien sabe de una buena aplicación para hacerlo de manera rápida y eficiente?

Compré Word Cleaner pero los resultados son simplemente suficientes y necesito revisar todos los archivos html generados para limpiar toneladas de etiquetas inyectadas inútiles como

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

La mayoría de los artículos que se muestran en un sitio web que administro se basan en documentos escritos en MS Word por personas que tienen poca idea de qué son los márgenes o listas ordenadas / desordenadas, notas al pie / final, etc. y no puedo hacer que usen otra cosa.

¿Alguien tiene un consejo para ayudarme a manejar esas páginas de manera más eficiente que revisarlas para corregir y aplicar mi estilo CSS?

NB: Solo para el registro, usar "Guardar como DOC HTML" en Word es mucho peor que el limpiador de Word

danie7LT
fuente

Respuestas:

4

Esto es lo que yo y el equipo aquí en el trabajo usamos cuando traemos contenido de MS Word a HTML:

http://word2cleanhtml.com/

Marcamos todas las casillas, pegamos el código y luego lo convertimos.

Espero que eso ayude.

KruegerDesigns
fuente
word2clean es de hecho un gran conversor, muy limpio y exactamente lo que necesitamos. Gracias !
danie7LT
Muy bien, me alegro de poder ayudar!
KruegerDesigns
3

Creo que la mejor solución para esto sería usar un editor WYSIWYG. TinyMCE, por ejemplo, es bueno, aunque sospecho que podría necesitar uno independiente. El uso sería similar a cualquier programa similar a una palabra, pero el resultado sería HTML directo. Además, ¿ha probado otros programas similares a palabras, como OpenOffice o LibreOffice? El HTML no es excelente, ya que tiene mucho estilo en línea, pero a partir de una prueba rápida parece que no tiene el problema de muchas etiquetas innecesarias.

milo5b
fuente
tinyMCE es genial y es lo que intento hacer que ELLOS use. Ya he agregado más opciones de formato para ayudarles a obtener lo que quieren lograr, pero es la migración en sí de Word a otra cosa que estoy luchando por lograr y, mientras tanto, sigo recibiendo archivos .doc. Pero gracias de todos modos, dices que openOffice da buenos resultados al convertir documentos a HTML, bueno, lo intentaré.
danie7LT