¿Existe una herramienta para dividir un archivo de texto grande (9 Gb) en archivos más pequeños para que pueda abrirlo y mirar?
¿Algo utilizable desde la línea de comandos que viene con Windows (XP)?
¿O cuál es la mejor manera de dividirlo? ¿Puedo usar 7z para crear volúmenes separados y luego descomprimir uno de ellos por separado? ¿Será legible o necesitará todas las otras partes para descomprimir en el archivo grande nuevamente?
Actualizar
Arme un script de python rápido de 48 líneas que divide el archivo grande en archivos de 0.5GB que son fáciles de abrir incluso en vim. Solo necesito mirar los datos hacia la última parte del registro (sí, es un archivo de registro). Cada registro se divide en varias líneas para que grep no funcione.
windows-xp
7-zip
text-editing
stefanB
fuente
fuente
grep -n
conhead
ytail
para ver fragmentos del archivo. Ejemplo,grep -n "something" file.txt
vuelve95625: something
. ¿Quieres ver esa línea y 9 líneas por debajo de ella para un total de 10 líneas:head -n 95635 file.txt | tail -n 10
.Respuestas:
Hay un divisor de archivos de Windows gratuito llamado HJSplit
Disponible aquí . El sitio web afirma que puede dividir archivos de cualquier tipo y tamaño, pero 9 GB es un archivo grande .
fuente
El paquete GNU Core Utils (disponible aquí para Windows) incluye la utilidad Split. A mí me funciona bien :-)
La documentación de --help es la siguiente:
Por ejemplo, para dividir input.txt en fragmentos de 100Mb, solo dividiendo en los extremos de las líneas,
le dará archivos de salida llamados xaa, xab, xac, etc.
fuente
Otro es GSplit : según su sitio, puede dividir archivos muy grandes (más grandes que 4 Gb <, ya que cruzaron el límite de 4 Gb, supongo que también pueden hacer 9 Gb).
Pero, otra cosa: dices que quieres dividirlo en partes más pequeñas para poder abrirlo y mirarlo. Eso suena como un archivo de registro quizás muy grande.
En cualquier caso, para abrir archivos de texto grandes, ¿puedo recomendar EmEditor ? Afirman que pueden abrir archivos muy grandes (hasta aproximadamente 250 Gb), y lo he usado en el pasado para archivos de hasta 2 Gb. Pero en cualquier caso, creo que puede ser una mejor solución que dividir.
fuente
Pieces > Type and Size
menú. Luego elige el número de líneas y el delimitador de línea en hexadecimal. Por defecto tiene el formato de Windows CR + LF (0x0D0x0A
).Echa un vistazo al Visor de archivos de texto grande , es ideal para cosas como esta. La mayoría de los archivadores y divisores separarán el archivo en partes que no se pueden usar para leer cada pieza de datos de forma independiente y adecuada, debe extraerlos todos para recuperar el archivo.
El visor de archivos de texto grande es gratuito y portátil.
fuente
echo. > myfile.txt
resolví el problema del archivo de registro de 818MB: DSe puede usar 7-Zip para crear segmentos de archivo de texto en cierto tamaño (por ejemplo, segmentos de 100 MB de un archivo de registro de 1,5 GB).
Las opciones clave son: use "Almacenar" en lugar de "Comprimir". Use "Dividir en volúmenes".
Debería poder ver el texto en archivos .001 (.nnn).
fuente
Puede usar 7zip para dividir los archivos. (Puede guardar en formato .zip o .7z). Cuando vaya a crear el archivo, hay una opción llamada "Volumen dividido, bytes". Solo selecciona qué tan grande quieres los trozos.
Y sí, puede descomprimirlos individualmente si lo desea.
fuente
Hay una herramienta en línea que divide archivos de texto si alguien está buscando dividir archivos rápidamente. http://www.textfilesplitter.com .
Funciona muy bien para mi. Y divide archivos respetando líneas, que es lo que estaba buscando. También dice que todo es del lado del cliente HTML5, por lo que es seguro de usar. No estoy seguro de lo grande que puede llegar, pero creo que depende de la memoria RAM de su máquina.
fuente
La idea de ver parte del archivo antes de decidir qué hacer con él es para mí la mejor opción.
La aplicación Large Text Viewer se puede instalar en Windows a través de Microsoft Store y ofrece una opción para cortar el archivo en trozos de tamaño. Es muy posible que use el mismo editor mencionado anteriormente (detrás de escena), pero la opción de instalarlo desde una fuente conocida es mejor en mi humilde opinión que los enlaces alternativos ofrecidos. Funciono muy bien para mi.
El único problema si se divide por tamaño es que no necesariamente rompe el archivo en un buen lugar, por lo que es posible que deba editarlo para capturar el contenido exacto que desea.
fuente