Estoy usando una variedad de herramientas para preparar regularmente datos para la web. Una etapa requiere que abra un CSV en Excel, realice cambios y guarde el archivo.
¿Hay alguna manera de obligar a Excel a aceptar la codificación UTF-8 y guardar sus archivos con esa codificación?
microsoft-excel
character-encoding
utf-8
Dizzley
fuente
fuente
Respuestas:
¿Respondí una pregunta similar en la codificación de caracteres predeterminada para el Asistente de texto de Excel? .
Encontré mi respuesta en Cambiar el tipo de origen de importación de texto predeterminado en Excel .
Como dice Vasille en el comentario a esta pregunta, si su archivo no está realmente en formato UTF-8, es posible que técnicamente desee convertir los caracteres dentro del archivo a la codificación que desea antes de abrir en Excel. Sin embargo, para mis propósitos, UTF-8 hace un buen trabajo al mostrar caracteres no dañados.
fuente
Una manera fácil de cambiar la codificación ANSI de Excel a UTF-8 es abrir el archivo .csv en el bloc de notas y luego seleccionar Archivo> Guardar como. Ahora, en la parte inferior, verá la codificación establecida en ANSI, cámbiela a UTF-8 y guarde el archivo como un archivo nuevo y listo.
fuente
Parece que el software de Microsoft Office requiere la marca de orden de bytes .
Usando Notepad ++, convierta el CSV usando el menú: Codificación -> Convertir a UTF8-BOM.
Usando la
sed
utilidad Unix, disponible en cmder o Git para Windows . Consulte Agregar BOM a archivos UTF-8 .fuente
Debe usar la
File > Import
opción y comenzar con un documento en blanco y especificarUTF-8
pero esto está lejos de ser óptimo para hacer que esta sea una configuración predeterminada para todos los archivos, de todos modos no es necesario rotar los archivos alrededor de Google Drive o LibreOffice. Los valores predeterminados están mal elegidos y la discapacidad para cambiar eso es irritante.
Relacionado
fuente
Resolví un problema similar antes. Sin éxito, pero puede usar LibreOffice , que es UTF-8 por defecto.
fuente
Hay un complemento de Excel disponible aquí para trabajar con archivos Unicode CSV que deberían ayudarte.
Aquí está la nota del desarrollador Jaimon Mathew:
fuente
No es la mejor solución, pero es una opción: suba su archivo de Excel a Google Drive, ábralo con Google Tabs y descárguelo como un archivo csv. A mi me funciono.
fuente
Suponiendo que tiene un shell de Unix disponible (Cygwin), agrego al frente del archivo csv una pequeña ID de Unicode de 3 caracteres (UTF-8) y luego se lee bien en Excel y, lo que es más importante, se procesa correctamente como entrada usando VB Excel automatización.
UTF-8.txt
EFBBBF << edición hexadecimal en un archivo de 3 caracteres.
cat UTF-8.txt file-to-use.csv> archivo_nuevo.csv
fuente
UTF-8.txt
archivo?