¿Cuáles son las probabilidades de que el tamaño del archivo permanezca igual si realiza una imagen en Photoshop?

0

Mi tío es un fotógrafo con muchísimas sesiones de fotos. Almacenó (duplicados de) copias de seguridad en una variedad de discos duros externos. El 90% de todas las copias de seguridad son iguales, pero algunas han tenido algunas modificaciones, como archivos agregados o imágenes retocadas. Ahora le conseguí un NAS con configuración RAID y un NAS fuera del sitio para realizar copias de seguridad adicionales de la máquina principal, para almacenar todos sus datos en un solo dispositivo. Me pidió que deduplicara todas las copias de seguridad y solo conservara la última versión, eliminando todas las copias.

Ya hay algunas aplicaciones (claro, recomiende una si conoce una (Mac / Windows) para identificar imágenes de copia cuando el tamaño y el nombre del archivo son iguales. Pero me preguntaba ...


TL; DR
¿Cuáles son las probabilidades de que una imagen mantenga el mismo tamaño de archivo cuando se hace photoshop?

//

Alternativamente: ¿Cuál es la mejor manera de identificar duplicados perfectos de imágenes?
En el caso, mi método de trabajo anterior (nombre de archivo / tamaño) no es la mejor manera de hacerlo.


Supuse que si las probabilidades son muy bajas (<1%), simplemente podría buscar y destruir y conservar 1 de cada archivo cuyo nombre y tamaño de archivo sean iguales.

Sander Schaeffer
fuente

Respuestas:

1

You can compute checksums on originals/copies and compare to see if anything has been changed.

This link explains it a bit more and offers some tools to help.

Hefewe1zen
fuente
Before actually checking your link: How easily is that, 200 images at a time, with a total of about 100.000 images? Update: I read the page. Checksums are a great way to verify differences. Remaining question: How easily is that per batch
Sander Schaeffer
I'm sure you could script it, if you really wanted to. However there is a superuser question which may help - superuser.com/questions/137155/…
Hefewe1zen
the thing is, most backup-oriented programs (such as the windows built-in robocopy) already use checksums to determine if files are changed. I think the real problem is a reliable dating of files, since checksums will not tell you which one is the original file and which one is the altered file. (edit: robocopy actually may not, but most still do!)
Yorik