Tengo 3 tipos de file name
codificaciones en el reiserfs
disco duro montado: CP1251, KOI-8, UTF-8 y ASCII. Realmente necesito convertir todas las codificaciones a UTF-8, recursivamente. ¿Hay alguna utilidad que detecte la codificación de origen y la convierta a UTF-8 o tengo que escribir el script Python?
8
detox
. Funcionó para mí entre ISO-8859-1 y UTF-8 usando-s iso8859_1-only
Respuestas:
Use convmv, una herramienta CLI que convierte el nombre del archivo entre diferentes codificaciones. Para convertir de (
-f
) estas configuraciones a (-t
) UTF-8, haga lo siguiente:Además, si desea convertir el contenido del archivo, use
iconv
una herramienta CLI para convertir el contenido del archivo a diferentes codificaciones. Para convertir de (-f
) estas configuraciones a (-t
) UTF-8, haga lo siguiente:fuente
No Una de las grandes desventajas del antiguo sistema de página de códigos es que no hay forma de detectar cuál se está utilizando; simplemente debes saber eso a priori. Si sabe qué archivos están usando qué codificación, entonces puede convertir los nombres usando algo como:
fuente
chardet
está detectando de alguna manera ...La misma solución con
iconv
sugeses @psusi pero con loop y while-card:También script de shell en línea
sh
:Con la lectura de la tarjeta while de la tubería:
fuente