No se puede abrir el archivo CSV

2

Tengo un archivo CSV de tamaño razonable (40 Megabytes). Sé que algunas aplicaciones no funcionarán con ciertas codificaciones, y que arrojarán errores si la codificación no es ASCII. Pero es alarmante que incluso TextEdit.app no pueda abrir este archivo.

Primero probé Numbers.app . Me aseguré de que esto no sea un error de Launch Services, porque abrí el archivo dentro de la aplicación. No se cargaría. La barra de progreso siempre se atasca a la mitad. Cuando abro este archivo CSV con TextEdit.app , tampoco se cargará. Ni siquiera Google Sheets. El archivo tiene solo 40 megabytes y solo tiene caracteres ASCII. El filecomando en ejecución en Terminal.app devuelve el siguiente mensaje:

file.csv: ASCII text, with very long lines.

Puedo abrir el archivo usando Visual Studio Code pero no en TextEdit.app . ¿Cómo puedo arreglarlo? Limpié el archivo para cualquier \rpersonaje.

Actualización : el wc -l file.csvcomando en ejecución regresa 176831. Mi sistema es un MacBookPro 2016 con 16 GB de RAM.

Michael Ilie
fuente
3
¿Cuántas líneas tiene (se ejecutan wc -l FILE.csven la Terminal para verificar)? ¿Qué sucede si intentas abrirlo en Textedit?
Nohillside
1
¿Alguna razón por la que desea abrirlo con un editor específico? Los editores varían en su capacidad para manejar un archivo voluminoso en la memoria. En general, veo tiempos de carga más rápidos con Sublime Text.app sobre TextEdit.app, por ejemplo.
Nimesh Neema
1
Además, sería útil si puede compartir la configuración de su sistema. Tal vez el sistema no tenga suficiente memoria para cargar el archivo CSV con gracia.
Nimesh Neema
Lo sé, estoy intentando editar texto, y 40 megabytes parece razonable
Michael Ilie
sistema tiene 16 gigas de ram
Michael Ilie

Respuestas:

1

Es bastante común que los programas GUI no puedan manejar archivos de texto grandes. Aunque 40 MB no suena como grande con respecto a los estándares actuales, pero eso puede aumentar mucho más en la memoria dependiendo de cómo se escriba la aplicación. Y las aplicaciones GUI a menudo no son las más eficientes.

Es posible que desee dividir el archivo de texto en varios más pequeños utilizando el terminal. Primero, verifique si puede abrir el archivo usando less filename.csven la Terminal, y si los caracteres se leen bien. De lo contrario, el archivo podría estar dañado y ese podría ser el problema.

Para la división aguda, intente usar algo como esto en la terminal:

#!/bin/bash
N=10000 # Number of lines per file
i=1
j=0
filename="hugefile.csv"
extension=.csv
while [ $i -le $(wc -l $filename|awk '{print $1}') ]
do 
    newfilename="$(basename $filename $extension)$j$extension"
    echo $newfilename: $i
    sed -n $i,$((i+$N))p $filename > $newfilename
    j=$((j+1)); i=$((i+$N))
done

Copie y pegue eso en un documento de texto sin formato (por ejemplo, TextEdit en modo de texto sin formato o nano en la Terminal) y split.shasígnele un nombre o algo similar. Personalice los parámetros Ny filenamesegún sea necesario, por ejemplo, ingrese el número deseado de números por archivo N=...y el nombre de archivo de su archivo fuente como filename="...". Esto generará la cantidad necesaria de archivos en su directorio actual para cubrir todas las líneas de los archivos de origen en archivos más pequeños de Nlíneas cada uno. Los archivos tendrán un número añadido, por ejemplo, hugefile0.txta hugefile9.txto algo por el estilo.

Ahora debería poder abrir cada uno de estos archivos en su aplicación deseada. A menudo es deseable trabajar con porciones más pequeñas de un archivo grande que con todo el archivo a la vez. Incluso podría abrir los archivos CSV resultantes en Numbers uno tras otro y copiar las líneas de cada archivo en un documento grande de Numbers. De esa manera, el importador probablemente no se quedará en un archivo tan grande.

En caso de que obtenga algún error con respecto a sedo awk, eso es porque Mac sedy awkson diferentes a los normales sedo awk. En ese caso, es posible que deba instalar regularmente sedy awkdesde algo como macports o homebrew.

LukeLR
fuente