Tengo muchos archivos que necesito ordenar; y lamentablemente hay muchos archivos con el mismo nombre pero diferente contenido, y hay el mismo contenido con diferentes nombres de archivo.
Estoy pensando en usar md5sum
para generar sumas de verificación para los archivos, pero necesito saber: ¿es posible que dos archivos diferentes (es decir, contenido diferente) generen la misma suma de verificación?
Si es así, ¿qué tan probable es que suceda?
¿Sería posible usar dos programas de suma de verificación diferentes no relacionados (es decir, no en la misma "familia") para generar dos sumas de verificación, bajo el supuesto de que si bien dos archivos diferentes pueden generar la misma suma de verificación para cualquiera de los programas de suma de verificación, nunca le pasaría a ambos a la vez?
Respuestas:
Dos archivos con el mismo contenido pero nombres de archivo diferentes: ( archivo1 y archivo2 ):
Dos archivos con diferentes contenidos pero los mismos nombres de archivo: ( archivo1 y archivo1 )
De la entrada de wiki ,
Pero, el algoritmo MD5 tiene sus propios defectos.
Recomendaría usar sha1 para calcular la suma de verificación ya que producir colisiones no es tan fácil cuando se usan algoritmos sha1 . Producir la suma de comprobación sha1 es bastante fácil como puedes ver aquí .
fuente
sha1
no es relevante para esa tarea; solo importa cuando le preocupa la seguridad .