Estoy buscando para encontrar líneas que no están duplicadas, ejemplo;
Archivo de texto 1:
cats 3 dogs 8 mice 4 pigs 10 ...
Archivo de texto 2:
dogs 8 mice 4 cats 78 pigs 29 bird 6 ...
Los gatos y los cerdos simplemente se cambiaron pero ahora son diferentes. Ambos archivos contienen 'perros 8' y 'ratones 4', por lo que la salida de diferentes líneas sería:
cats 78 pigs 29 bird 6
Esperaba que estuviera buscando una forma de hacerlo en una terminal de Linux como; comando input1.txt input2.txt diffrences.txt
Respuestas:
Si los archivos están bien ordenados, podrías hacer algo tan simple como esto.
Si los archivos no están ordenados y desea buscar líneas únicas, puede hacer algo como esto en su lugar.
Teniendo en cuenta los archivos anteriores, se verá esto.
Claro, simplemente apílelo a través de grep.
fuente
can this handle large files gb's sizes?
- Puede, pero potencialmente será lento. La parte más lenta será la clasificación de archivos grandes. He usado esto para comparar archivos de registro bastante grandes. Actualicé la pregunta para incluir el ejemplo de filtrado.