¿Método para restar cadenas de texto comunes en dos archivos?

0

Tengo dos archivos de texto, uno con 100,000 cadenas y el otro con 1,000 cadenas, que ya están presentes en el archivo más grande. Me gustaría restar esas 1,000 cadenas, para que el archivo más grande contenga solo 99,000. No se trata de eliminar duplicados, sino de eliminar cadenas.

¿Hay un comando para hacerlo.

george
fuente
¿Qué sistema operativo está ejecutando? Esto parece algo que podrías hacer en la línea de comandos de Linux con varios métodos diferentes.
drk.com.ar
Win XP, me temo que ...
george
¿Puede proporcionar muestras de ambos archivos con un tamaño más pequeño y cuáles son los resultados esperados?
R Sahu
¿Considerarías instalar MSYS en tu Windows?
drk.com.ar
Yo instalaría MSYS!
george

Respuestas:

0

Si las cadenas están todas en líneas separadas, puede usar grep desde MSYS o cygwin como sigue:

C:\> grep -v -f thousandLine.txt hundred000line.txt >ninetynine000Line.txt

los -v La opción invierte la coincidencia para que la salida sea todas las líneas en hundred000line.txt que no coinciden con ninguna línea en thousandLine.txt. Ver el manual de grep para más información.

Simon
fuente