¿Cómo puedo encontrar canciones duplicadas?

Respuestas:

24

dupeGuru Music Edition es lo que quieres. Establezca el tipo de escaneo en "Contenido de audio" en Preferencias. Tenga en cuenta que el programa es justo, por lo que puede contribuir si puede.

texto alternativo

Le sugiero que combine esto con MusicBrainz Picard, que puede etiquetar sus archivos de música automáticamente.

texto alternativo

Li Lo
fuente
¡PERFECTO! Finalmente una respuesta que funcionó a las mil maravillas :). Un complemento Banshee o lo que sea hubiera sido aún mejor, ¡pero esto funciona muy bien! De hecho, eliminé alrededor de 8 GB de engaños, ¡salud!
Ingo
2
Lástima que dupeGuru solo puede hacer 10 eliminaciones a la vez sin dejar dinero.
John McKean Pruitt
El PPA está muerto para los últimos lanzamientos de Ubuntu. Tuve éxito al instalar el .deb directamente desde launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351 y luego ejecutardupeguru_me .
rjh
La versión más reciente no tiene límite en las eliminaciones. Sin embargo, no parece tomar la huella digital de la música, solo compara nombres de archivos / información ID3. Si usa una herramienta como Picard para etiquetar su música primero, debería hacer un buen trabajo :)
rjh
10

Hay un complemento que se creó hace algún tiempo para esto. Lo he usado recientemente pero todavía deja un poco que desear. Hay un " PPA " para ello, pero aún no hay paquetes integrados, solo la sucursal del Bazar. Las instrucciones de instalación son más o menos así:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Si está interesado en usar el código fuente de Bazaar'd, haga lo siguiente:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

Una vez instalado, reinicie Rhythmbox y debería tener un Buscador de duplicados ahora en la lista de complementos.

lista de complementos

Después de activarlo, hay opciones de configuración adicionales disponibles.

ventana de configuracion

Después de habilitar el complemento, y cuando encuentre duplicados, agregará una opción adicional a su lista de bibliotecas:

lista

Algunas configuraciones que he encontrado como "extrañas": he probado esto en una biblioteca multimedia con más de 120,000 canciones (más de 1,000 duplicados) y una biblioteca con aproximadamente 1,000 canciones y quizás 30 duplicados. En el primero, tardó mucho tiempo y estrelló a Rhythmbox varias veces durante la búsqueda. Finalmente elegí "Eliminar de la biblioteca" automáticamente para evitar tener que reconstruir la lista. Sin embargo, en bibliotecas más pequeñas todo funciona muy bien.

Cuando se encuentra un duplicado, si tiene las opciones predeterminadas seleccionadas, la versión de menor calidad de la canción se agregará a la lista. Por lo tanto, es seguro seleccionar todas las canciones en la lista de duplicados y "Eliminar" (eliminar del disco o eliminar de la biblioteca).

Marco Ceppi
fuente
Muchas gracias por dar este consejo! Sin embargo, nada parece suceder una vez que lo activé. No puedo encontrar una nueva pestaña o lo que sea que indiquen los duplicados.
Ingo
Es posible que deba mover el umbral a 0.5 para ayudar a ordenar los duplicados. Se mostrará como un elemento adicional en su lista de bibliotecas. He actualizado la respuesta para mostrar esto.
Marco Ceppi
Intenté eso también. Sin éxito.
Ingo
5

Puedes usar fdupes para eso:

$ fdupes -r ~/Music

que le da una lista de todos los archivos duplicados.

Puedes instalarlo fácilmente con

sudo apt-get install fdupes
Johann
fuente
44
Esto funcionó mejor que las otras opciones. Sin embargo, realmente no parece ser adecuado para archivos de audio. El software no compara etiquetas, etc., lo que lleva a una lista muy corta de archivos, mientras que en realidad hay muchos duplicados, sin embargo, tal vez no con exactamente el mismo tamaño de archivo (ya que pueden ser de diferentes fuentes).
Ingo
3

Me encontré con un problema similar cuando tenía un montón de archivos de imagen duplicados. En mi caso, solo usémd5sum los archivos y ordené los resultados:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

Los archivos con el mismo contenido generan el mismo hash, por lo que se pueden encontrar duplicados fácilmente. Eliminé manualmente los engaños desde allí, aunque podría haber extendido el script para eliminar todo excepto la primera vez, pero siempre estoy paranoico sobre hacerlo en un script ad-hoc.

Tenga en cuenta que esto solo funciona para archivos duplicados con contenidos idénticos .

John Bode
fuente
Más rápido:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Robert Vila
1

Prueba FSlint o Dupe Gredtter

Para instalar el tipo FSlint en la terminal (Ctrl-Alt-T)

sudo apt-get install fslint

Espero que esto sea útil.

DIVERSADOR DE FOSS
fuente
-2

He usado FSlint para encontrar archivos duplicados en general. FSlint es "una utilidad para encontrar y limpiar varias formas de pelusa en un sistema de archivos".

Aputsiak
fuente
Eso es extraño. ¡FSlint no encuentra ninguna de mis canciones duplicadas!
Ingo
FSlint tiene una configuración predeterminada que probablemente encuentre archivos duplicados medidos por nombre de archivo y tamaño de archivo, pero no duplicará canciones si se trata de grabaciones diferentes con diferente tamaño y nombre de archivo.
Aputsiak
Las diferentes grabaciones (¿remezclas?) No son seguras para su eliminación. Pueden tener valor propio.
Extender el
También he usado fslint para audio (con éxito razonable), aunque dada algunas de las alternativas en este hilo, probablemente probaré una de ellas la próxima vez.
belacqua