A veces recibo archivos de mis clientes que tienen la extensión de archivo incorrecta. Por ejemplo, el nombre es image.jpg
pero el archivo es en realidad una imagen TIFF. En muchos casos, puedo aclararlo abriendo el archivo en un editor de texto, mirando los primeros bytes y luego deduciendo qué tipo de archivo es.
Esto funciona para mí con archivos JPEG, TIFF, GIF y PDF. Sin embargo, hay muchos más tipos de archivos por ahí.
¿Es posible automatizar la identificación del tipo de archivo correcto analizando los datos que lo contienen?
file
comando hace esto en máquinas * nix.windows
, pero el comentario implica: "No puede hacer eso en Windows, debe usar * nix en su lugar". ¿Entonces? El comentario está dirigido "para los interesados". ¿En que? ¿Cambiar computadora?:(
Respuestas:
Puede usar la herramienta TrID que tiene una biblioteca creciente de definiciones de tipos de archivos para identificar archivos.
Los comodines son compatibles, por lo que, en su ejemplo, podría poner todas las imágenes para examinarlas en una carpeta, por ejemplo, C: \ verificadoimages, luego puede usar el comando:
Esto examinará todos los archivos en la
verifyimages
carpeta.También hay una versión de GUI disponible, TrIDNet :
Hay documentación disponible sobre cómo puede integrar fácilmente TrID o TrIDNet en Windows Explorer y Total Commander:
Explorador de Windows
Comandante total
fuente
archivo
fuente
file
es estándar, pero en sistemas más antiguos (especialmente no Linux) no muy bien informados. Para Ubuntu, etc., debe ser bastante respetable e incluso instalarse como estándar.file
Windows. Si otros comandos * nix son interesantes para usted como usuario de Windows, busque en ese sitio para encontrar todo tipo de gemas.file
sea un experto en archivos creados por aplicaciones de Windows.file
y, sin embargo, casi has tomado una decisión sobre su efectividad.Solía trabajar para la Biblioteca Nacional de Francia, para construir un sistema de archivo digital que contiene no solo libros digitalizados sino también millones de artefactos digitales con todo tipo de archivos extraños. Utilizamos JHOVE para reconocer formatos de archivo.
JHOVE es de código abierto, es mantenido por JSTOR y la Biblioteca de la Universidad de Harvard. Es bastante simple de usar .
fuente
Uso las bibliotecas OutsideIn de Oracle en mis programas. No son gratis, pero funcionan bien, especialmente para imágenes. El discurso del mercado dice que admite más de 500 tipos de archivos.
fuente
Puede verificar el tipo de archivo desde cualquier computadora, incluidas las ventanas en
http://www.checkfiletype.com
fuente