Tengo un archivo grande que contiene registros en varias líneas. ex:
domain1 NS ns1
domain1 NS ns2
domain1 NS ns3
domain2 NS dnsx
¿Cuál podría ser la forma más rápida de generar un CSV del formulario?
domain1,ns1,ns2,ns3
domain2, dnsx
Probé scripts php y groovy, pero el tiempo de carga del procesador es demasiado alto para un archivo (leído) de un archivo de 1 Gb (y la consiguiente escritura en un archivo csv).
Estoy pensando que debería haber un mejor enfoque programático que lo que estoy haciendo. Básicamente, estoy creando una lista / matriz para contener registros y verificar el último elemento si se encuentra el mismo dominio en la línea actual que se está verificando.
PD: mencionó groovy / php, pero la respuesta puede no tener relación con estos lenguajes de script específicos.
Respuestas:
Suponiendo que todos los registros con el mismo dominio estén agrupados, este programa awk tendrá una huella de memoria muy pequeña (no puedo decir cuál será la carga de la CPU)
fuente