Tengo un montón de mensajes duplicados en el servidor Maildir de mi servidor IMAP. ¿Cuál es la mejor manera de eliminarlos?
Algunos puntos relevantes:
- El ID de mensaje compartido suele ser una definición suficientemente buena de duplicado. Un pequeño script que elimina todos los mensajes duplicados, excepto uno, funcionaría.
- A veces es necesario encontrar duplicados basados en cuerpos de mensajes compartidos. ¿Cuál es una definición razonable de compartido aquí? Bitwise equivalente? ¿Qué pasa con las extrañas diferencias en el ajuste de línea, el escape y la codificación de caracteres?
- A veces hay una diferencia significativa entre los mensajes 'duplicados'. ¿Cuál es la mejor manera de revisar las diferencias en conjuntos de mensajes 'duplicados'? Diferencias?
para archivos genéricos en Linux, utilizo utilidades fdupes para eliminar archivos duplicados. Descubrí que también funciona para los mensajes de Maildir.
fuente
.forward
o lo que sea tendrá encabezados ligeramente diferentes, por lo que si bien el mensaje en sí es un duplicado, los dos archivos que contienen las dos copias pueden no serlo.La evolución de Gnome [un agente de usuario de correo gráfico] tiene una función incorporada para eliminar el correo duplicado. Como se explica en esta página de ayuda , se reduce a:
Voilà.
PS Evolution puede acceder a sus mensajes localmente (MailDir, MH, Mbox) o por IMAP.
fuente
Lo mejor que he encontrado hoy es el deduplicado maildir de Kevin Deldycke .
X-MIMETrack
encabezado de forma predeterminada y compara los encabezados utilizando elSHA224
resumen.Apuesto a que alguien podría hacer algo elegante con delIMAPdups.pl de Rick Sanders , parte de sus Herramientas IMAP .
fuente
maildir-deduplicate
me mudé a una nueva ubicación, así que actualicé el enlace. Sin embargo, su información ahora está desactualizada.