¿Cómo puedo encontrar fotos duplicadas?

Respuestas:

60

digiKam Instalar a través del centro de software

Agrega todas las fotos a tu colección. En el menú, seleccione "Herramientas / Buscar duplicados". Esto buscará duplicados en toda su colección.

encontrar imágenes Instalar a través del centro de software

Una herramienta de línea de comando. Pase todas las imágenes que desea comparar en la línea de comando.

Geeqie (anteriormente GQview )Instalar a través del centro de software

En el menú, seleccione "Archivo / Buscar duplicado". Arrastre y suelte archivos de imagen en la ventana de duplicados. Puede soltar directorios para agregar sus contenidos de forma recursiva. Para la comparación visual de imágenes, hay opciones específicas no predeterminadas en un menú desplegable. El nivel de similitud "personalizado" permite restringir los emparejamientos solo al más alto grado de similitud, pero debe establecerse en "Preferencias" como 99. Incluso entonces, no funciona perfectamente al menos para algunos tipos de imágenes, como líneas. Arte. Desafortunadamente, no proporciona un mecanismo de selección automática con criterios racionales, como resolución, fecha o lo que sea, la selección automática parece elegir aleatoriamente la primera imagen encontrada como referencia para preservar. Eliminar muchas imágenes puede ser extremadamente lento, ya que intenta actualizar el recuento de resultados en cada eliminación.


Las tres herramientas encuentran duplicados visuales, no solo archivos que son idénticos byte por byte.

Gilles 'SO- deja de ser malvado'
fuente
77
Descubrí que Geeqie funciona mejor. Tiene un conjunto robusto de modos de búsqueda (nombre, suma de verificación, tamaño, etc.), escaneo de similitud de imagen potente, información detallada de duplicados encontrados, interfaz de usuario simple y no es necesario agregar imágenes a una colección o álbum primero. Mi único inconveniente es que el Buscador duplicado está oculto debajo del menú Archivo y tiene que arrastrar y soltar desde Nautilus (u otro FM) para agregar imágenes / carpetas para buscar. Aparte de eso, hace el trabajo y lo hace bien.
japzone
2
Geeqie puede encontrar imágenes similares y funciona bastante bien, pero lo encontré un poco lento para las coincidencias exactas y es tedioso eliminar muchos duplicados con él.
Wernight
Otra opción (que parece funcionar bastante bien), es esta herramienta también llamada findimagedupes , pero no está relacionada con la herramienta alojada en Sourceforge.
Winny el
Digikam tiene una sorprendente interfaz de búsqueda de duplicados. Te lo recomiendo mucho.
wbkang
22

FSlint Instalar FSlint

fslintes un programa gráfico que puede encontrar archivos duplicados de cualquier tipo mediante md5sum. Si las imágenes no son idénticas, no se marcarán como duplicados. La imagen a continuación muestra un montón de archivos pdf duplicados en mi directorio de Descargas:

ingrese la descripción de la imagen aquí

Puede cambiar los parámetros de búsqueda avanzada para buscar por tipo de archivo y restringirse solo a las imágenes. Eso se hace cambiando los "parámetros de búsqueda extra" como findopciones de comando. Por ejemplo, aquí solo estoy buscando *.jpgarchivos (en la misma ruta, solo mirando mi carpeta "Descargas":

ingrese la descripción de la imagen aquí

fdupes Instalar fdupes

fdupeses una herramienta equivalente basada en la línea de comandos. Ambos están disponibles en los repositorios.

John Lyon
fuente
12
Tenga en cuenta que dudo que estos programas encuentren duplicados redimensionados.
Vadim Peretokin
@Vadi esa es una pregunta diferente y más complicada. Tineye realiza una identificación de imágenes que no se basa en metadatos, hashes, etc. (puede identificar imágenes de aspecto similar) pero es un servicio en línea. Proporcionan una API, pero aún no conozco ninguna aplicación que se aproveche de esto. La otra complicación es que no querrás eliminar imágenes similares todo el tiempo, por ejemplo, si editas fotos pero quieres conservar copias de los originales. Eliminar duplicados idénticos es mucho más seguro.
John Lyon
44
El OP establece explícitamente "incluyendo fotos que han sido redimensionadas", por lo que esta no es una respuesta.
Calimo
7

fdupes Instalar fdupes

Puede usar una herramienta de línea de comandos llamada fdupespara buscar archivos duplicados (consulte man fdupespara más detalles). No conozco ninguna forma de encontrar 'duplicados' que hayan sido redimensionados. Un programa que hiciera esto requeriría algún tipo de algoritmo inteligente que analizara el contenido de la imagen porque cuando se cambia el tamaño de una imagen, sus datos cambian para que los métodos tradicionales de búsqueda de duplicados no funcionen.

dv3500ea
fuente
fdupes también perderá duplicados en diferentes directorios; supongamos que tiene dos copias de una foto, una en la carpeta birthday-party / y la otra en family-stuff / ... "fdupes -fr". Perderé este duplicado.
lrkwz
2
fdupes no maneja duplicados que han sido redimensionados, ni cambios en los metadatos.
Calimo
6

imgSeek Instalar imgseek

imgSeek puede encontrar duplicados e imágenes similares (por lo que debería poder encontrar fotos redimensionadas y fotos con diferentes nombres de archivo y metadatos) e incluso buscar fotos basadas en un boceto. Está disponible en versiones de escritorio y servidor.

Sin embargo, no lo he probado yo mismo.

david.libremone
fuente
solo disponible para Ubuntu 10.04, aunque hay una biblioteca perl para 12.04
drevicko
La versión del servidor isk-daemonfunciona en 12.04, aunque descubrí que tenía que instalar desde la fuente ( pip installsegún la página de instalación no funcionaba)
drevicko
4

dupeGuru Picture Edition funciona absolutamente genial, y vale la pena intentarlo.

Tienen un PPA Launchpad , dupeguru( dupeguru-pese puede instalar un nuevo paquete todo en uno) o (paquete de edición de imagen anterior) usando esos comandos:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
tuxflo
fuente
Parece que dupeGuru ahora no tiene ediciones separadas. Funciona bien, aunque la interfaz de usuario podría ser mejor. También está disponible en AUR si usa Arch.
user31389
2

Visipics

Visipics es una aplicación gratuita de Windows para esa función, pero funciona muy bien en Linux, a través de wine, por supuesto (es mejor que geeqie / gqview con respecto a la clasificación de los duplicados (los resultados de geeqie son absolutamente "no clasificables")).

Puede indicarle que seleccione automáticamente las imágenes según criterios como tamaño de archivo más pequeño, tipo no comprimido, resolución más baja (sin embargo, no hará lo contrario, necesitaría hacerlo manualmente, lo que no sería mucho mejor que hacerlo en geeqie, excepto que la selección no requiere mantener Shift/ Ctrl), e incluso priorizar carpetas (pero la última prioridad es la prioridad de carpeta).

Sin embargo, debe prestar atención a los enlaces simbólicos: puede seleccionar "aleatoriamente" guardar un enlace simbólico en un archivo mientras elimina el archivo real como una "copia". Es una pena.

el dsc
fuente