Eliminar mensajes duplicados de Maildir

10

Tengo un montón de mensajes duplicados en el servidor Maildir de mi servidor IMAP. ¿Cuál es la mejor manera de eliminarlos?

Algunos puntos relevantes:

  • El ID de mensaje compartido suele ser una definición suficientemente buena de duplicado. Un pequeño script que elimina todos los mensajes duplicados, excepto uno, funcionaría.
  • A veces es necesario encontrar duplicados basados ​​en cuerpos de mensajes compartidos. ¿Cuál es una definición razonable de compartido aquí? Bitwise equivalente? ¿Qué pasa con las extrañas diferencias en el ajuste de línea, el escape y la codificación de caracteres?
  • A veces hay una diferencia significativa entre los mensajes 'duplicados'. ¿Cuál es la mejor manera de revisar las diferencias en conjuntos de mensajes 'duplicados'? Diferencias?
Joseph Holsten
fuente

Respuestas:

3

para archivos genéricos en Linux, utilizo utilidades fdupes para eliminar archivos duplicados. Descubrí que también funciona para los mensajes de Maildir.

sarabande
fuente
1
fdupes parece funcionar solo para duplicados exactos, mientras que el OP pregunta (implícitamente) sobre patrones de duplicación más complejos. Un mensaje entregado dos veces debido .forwardo lo que sea tendrá encabezados ligeramente diferentes, por lo que si bien el mensaje en sí es un duplicado, los dos archivos que contienen las dos copias pueden no serlo.
tripleee
0

La evolución de Gnome [un agente de usuario de correo gráfico] tiene una función incorporada para eliminar el correo duplicado. Como se explica en esta página de ayuda , se reduce a:

  1. Seleccione los mensajes sospechosos (o solo todos los mensajes)
  2. Vaya al menú Mensajes , elija Eliminar mensajes duplicados .

Voilà.

PS Evolution puede acceder a sus mensajes localmente (MailDir, MH, Mbox) o por IMAP.

Franklin Piat
fuente
0

Lo mejor que he encontrado hoy es el deduplicado maildir de Kevin Deldycke .

  • Ignora el X-MIMETrackencabezado de forma predeterminada y compara los encabezados utilizando el SHA224resumen.
  • Elimina automáticamente duplicados sin pedir confirmación; sin embargo, hay un modo de ejecución en seco que permite previsualizar qué duplicados se eliminarán.

Apuesto a que alguien podría hacer algo elegante con delIMAPdups.pl de Rick Sanders , parte de sus Herramientas IMAP .

Joseph Holsten
fuente
maildir-deduplicate me mudé a una nueva ubicación, así que actualicé el enlace. Sin embargo, su información ahora está desactualizada.
Adam Spires
He actualizado esto para que ya no haya información obsoleta engañosa.
Adam Spires