Comando de archivo de Linux

1

He notado que el filecomando de Linux no devuelve ningún valor si un archivo xml tiene el <?xml version="1.0" encoding="UTF-8"?>en la parte superior. Si falta el prólogo, file -i somefile.xmldevuelve algún valor. ¿Alguien tiene alguna idea de por qué sucede esto? Básicamente, estoy interesado en conocer la codificación del archivo y he encontrado file -i filename.xmlalgo útil, pero ¿hay algo mejor disponible en Linux para calcular la codificación y el juego de caracteres?


fuente

Respuestas:

2

El archivo se basa en la firma en el archivo mágico , es bastante seguro que solo está mirando el prólogo, no escaneando partes del archivo para simplificarlo.

jdehaan
fuente
Eso es lo que me pregunto si tal vez solo mira el prólogo que no es realmente útil porque puedo codificar el archivo en X y escribir Y en el prólogo
1

Adivinar codificaciones es un arte negro que incluso los navegadores populares no pueden hacer exactamente bien. Le sugiero que deje que su analizador obedezca la codificación XML, rompa en voz alta si la codificación no es válida, y que corrija los errores de codificación en la fuente.

Tobu
fuente