Tengo dos archivos con 3 GB cada uno para hacer una comparación y almacenar los datos de diferencia en el tercer archivo.
A continuación se muestran los datos de muestra.
Archivo 1 : June_01_2018.csv
Archivo 2 : June_02_2018.csv
Nota : Quiero almacenar la diferencia en el tercer archivo con los encabezados de columna.
Resultado esperado : el tercer archivo debe contener los registros del ID
11 al 15 con los encabezados de columna.
Mi intento : fc
comando en el símbolo del sistema,
>fc June_01_2018.csv June_02_2018.csv > June_Diff.csv
Pero obteniendo resultados inesperados:
fc
es una herramienta de línea de comandos interactiva, es decir, siempre producirá una salida legible por humanos. Además, compara los archivos de texto línea por línea y no conoce el significado de las líneas. En su caso, la primera línea que contiene los encabezados de columna es idéntica en ambos archivos, por lo que no se imprime. Si lee los documentos , verá que su salida es la salida esperada. Dudo quefc
sea la herramienta adecuada para esta tarea.Respuestas:
Las esperanzas no tienen nada que ver con las expectativas (realistas).
El encabezado es exactamente el mismo, por lo que nunca podría ser una diferencia.
Además, la representación de Excel no es el archivo csv, debe publicar los archivos originales como texto.
El siguiente archivo por lotes lee en el encabezado y hace eco a la diferencia.
En lugar de fc, usa findtr con opciones
Variante con fc
Eso deja solo la línea final.
fuente
FINDSTR: Search string too long
.comparing
y*****