Tengo dos directorios: old/
y new/
. Algunos de los archivos en old/
son duplicados de aquellos en new/
. Algunos simplemente tienen el mismo nombre, y algunos incluso pueden tener contenido idéntico pero nombres diferentes. No estoy interesado en la ruta del subdirectorio a los archivos, por lo que solo un nombre de archivo no calificado debe considerarse en la coincidencia.
Quiero eliminar los archivos duplicados old/
, para que solo contenga archivos que no se encuentran también en new/
. Para los casos en que los nombres de archivo coinciden, pero no los contenidos, o viceversa, quiero que esto aparezca en algún registro.
¿Alguien ha encontrado un problema similar o tiene una solución mejor que hackear un script (perl o similar) desde cero? Un tiempo de ejecución dominado por la invocación md5sum
de cada archivo es aceptable.
fdupes : encuentra archivos duplicados en un conjunto dado de directorios
-d para borrar
-N para no preguntar
fuente