Eliminar mp3 duplicado con diferente nombre, tamaño y hash

9

Tengo una biblioteca de música masiva (todo mp3), pero parte de la música es casi la misma pero:

  1. Tal vez uno o dos segundos más
  2. Alrededor del 97% lo mismo que otra canción.
  3. O otra tasa de bits.

¿Hay alguna manera de encontrar estos duplicados? Como se mencionó, no tienen el mismo tamaño, nombre o SHA1-hash.

Hans Groeffen
fuente

Respuestas:

3

Hay un sistema de huellas dactilares acústicas de código abierto llamado Echoprint , es posible que desee verificar que quiero deduplicar una gran colección . No lo he usado antes (solo me topé con él), pero suena increíble poder hacerlo localmente.

Adrian Frühwirth
fuente
Independientemente de esto, si sus archivos están etiquetados correctamente (no estoy seguro de si por nombre se refiere a nombres de archivo y / o etiquetas ID3), también hay herramientas de deduplicación que funcionan en función de las etiquetas.
Adrian Frühwirth
6

Usa el Picard de MusicBrainz . Escanea la música para generar una 'huella digital' y luego la compara con una base de datos en línea para identificarla (obteniendo toda la información como Artista, Álbum, etc.).

Después de identificar las canciones, puede organizarlas en un directorio personalizado y una estructura de nombres, y puede usar eso para encontrar los duplicados.

Totalmente compatible con Linux.

Patricio
fuente
Este es el camino definitivo, funciona muy bien.
slm
Ok, creo que tengo un problema. Nada de mi música es comercial. La mayor parte tiene licencia CC descargada de Jamendo. Dice que no puede encontrar ninguna coincidencia.
Hans Groeffen
@HansGroeffen entonces eso sería un problema. Se le permite publicar huellas digitales de música previamente desconocida, por lo que puede hacer eso, pero debe hacer un esfuerzo para validar que la presentación sea precisa. Como tiene nombres que no coinciden, puede que no sea una buena idea. No estoy seguro de si hay una manera de usarlo solo por sus capacidades de comparación y huellas digitales.
Patrick
2
La base de datos MusicBrainz que utiliza Picard es editable por el usuario. Puede crear nuevas entradas para artistas, obras (canciones) y lanzamientos (álbumes / EP), y luego usar Picard para volver a etiquetar / mover los archivos. Es un poco de esfuerzo, pero funciona, y es útil para otros.
naught101
3

Recomiendo usar beetscon su duplicatescomplemento; beetses similar picarden términos de funcionalidad (puede buscar información ID3 de la base de datos de musicbrainz y organizar sus archivos en función de esa información), pero va más allá de las capacidades de picard con algunos de sus complementos.

Personalmente, los uso juntos: picard para limpiar etiquetas ID3 y remolachas para organizar los archivos y limpiar duplicados.

STW
fuente