Tengo dos documentos ODT, tienen contenidos muy cercanos, quiero compararlos para ver qué tan similares son.
Lo mejor sería tener un porcentaje de similitud , si no es posible, una alternativa sería al menos tener algún tipo de diferencia .
Estoy ejecutando Ubuntu Lucid .
Solución:
Solía odt2txt
convertir los archivos a texto, luego wdiff -i --statistics one.txt two.txt
tenía una diferencia junto con estadísticas que me daban el porcentaje de palabras comunes (similitud).
Respuestas:
No los he probado yo mismo, pero este par de herramientas , odt2txt y oodiff, parece prometedor.
fuente
¿Probaste la funcionalidad de comparación incorporada? Editar / Comparar documento ...
Si solo desea una diferencia textual, su mejor opción es probablemente convertir ambos documentos en texto sin formato, luego ejecutar una diferencia regular en ellos. Sin embargo, tendrá que descubrir cómo normalizar los saltos de línea, de lo contrario, la diferencia no será muy útil.
fuente
Si no le importa el formato de texto, también puede copiar el contenido a archivos de texto sin formato y usar un buen diff antiguo.
PD: ¿Eres un maestro en busca de posibles tramposos? :pag
fuente
La forma en que hago esto es producir archivos .pdf con libreoffice y luego usar diffpdf para comparar los dos archivos pdf. Esto muestra las diferencias resaltadas en ventanas paralelas
fuente