Similitud y / o diferencia de dos documentos ODT (Linux)

14

Tengo dos documentos ODT, tienen contenidos muy cercanos, quiero compararlos para ver qué tan similares son.

Lo mejor sería tener un porcentaje de similitud , si no es posible, una alternativa sería al menos tener algún tipo de diferencia .

Estoy ejecutando Ubuntu Lucid .


Solución:

Solía odt2txtconvertir los archivos a texto, luego wdiff -i --statistics one.txt two.txttenía una diferencia junto con estadísticas que me daban el porcentaje de palabras comunes (similitud).

Weboide
fuente

Respuestas:

8

No los he probado yo mismo, pero este par de herramientas , odt2txt y oodiff, parece prometedor.

JRobert
fuente
1
Usé odt2txt para convertirlos a texto, y luego usé wdiff que da una diferencia por palabra.
Weboide
Gracias. Esto es ideal para usar en sistemas de control de versiones como git o mercurial. Ver técnicas de integración / automatización en OpenDocument, diff y revision-control
nealmcb
20

¿Probaste la funcionalidad de comparación incorporada? Editar / Comparar documento ...

Si solo desea una diferencia textual, su mejor opción es probablemente convertir ambos documentos en texto sin formato, luego ejecutar una diferencia regular en ellos. Sin embargo, tendrá que descubrir cómo normalizar los saltos de línea, de lo contrario, la diferencia no será muy útil.

sleske
fuente
1
Gran función en LibreOffice, ¡nunca había oído hablar de eso! Muy útil pero no se dan estadísticas.
Stragu
¡Excelente! Nunca hubiera pensado mirar en un menú Editar para comparar documentos. Miré en Archivo , Herramientas y Ventana , siendo la última la ubicación de Word de uSoft.
wallyk
44
En la última versión parece ser Editar -> Seguir cambios -> Comparar documento ...
FableBlaze
1

Si no le importa el formato de texto, también puede copiar el contenido a archivos de texto sin formato y usar un buen diff antiguo.

PD: ¿Eres un maestro en busca de posibles tramposos? :pag

Tamtakos
fuente
lol no, no soy un profesor, pero sí, esta sería una buena manera de buscar tramposos :)
Weboide
1

La forma en que hago esto es producir archivos .pdf con libreoffice y luego usar diffpdf para comparar los dos archivos pdf. Esto muestra las diferencias resaltadas en ventanas paralelas

Peter Allott
fuente