Zip, Rar, 7z, Gzip, BZip2, Tar, etc. Escuché que 7z es el sabor del mes, ¿por qué? ¿Es mejor para todas las situaciones o hay mejores opciones para situaciones específicas?
¿O tal vez el archivo de archivo real, es decir, WinZip, WinRar, 7Zip, etc. (a diferencia del formato) tiene un efecto mayor?
En su respuesta, ¿podría describir qué tipo de compensación de velocidad / compresión utiliza su formato mencionado?
Proporcione enlaces a cualquier prueba empírica que respalde su respuesta.
Antecedentes: necesito hacer una copia de seguridad de un índice de búsqueda personalizado que crea aproximadamente 3000 archivos relativamente pequeños (menos de 10 MB), cada uno con una gran cantidad de datos repetitivos.
(Como de costumbre, Wikipedia tiene un artículo relevante, pero la sección sobre comparación de rendimiento es breve).
Gracias
fuente
Lectura recomendada:
Compresión de archivos en la era de múltiples núcleos (Jeff Atwood, alias CodingHorror, febrero de 2009)
Y con respecto a los algoritmos:
fuente
No se trata solo de eficiencia y velocidad. Claro que son importantes y puede mirar los puntos de referencia para esos y elegir sabiamente entre las opciones (aunque recomendaría algunos puntos de referencia simples con sus propios datos en su propio servidor). Pero el archivo inevitablemente conduce en algún momento al acceso a sus datos nuevamente (de lo contrario, ¿por qué no simplemente eliminarlos?). O tal vez en el futuro, no será usted el que acceda a los datos, sino alguien de terceros. Elija algo que estará disponible cuando necesite acceder a los datos y algo que la gente reconozca. Yo personalmente uso 7zip, pero cuando archivo archivos que otros pueden necesitar, uso zip. Lo saben, muchas herramientas pueden manejarlo. Puede que no sea tan rápido o tan pequeño, pero ayuda con el factor humano.
fuente
Parece que lzma funciona muy bien tanto en relación de compresión como en velocidad.
En los siguientes http://tukaani.org/lzma/benchmarks benchmarks, la configuración más rápida para lzma proporcionó tiempos de compresión considerablemente más rápidos que la opción bzip2 más rápida, y al mismo tiempo mejor compresión que la opción más lenta bzip2:
Funciona especialmente bien con datos binarios, pero creo que leí algunos puntos de referencia de texto plano donde bzip2 lo superó.
Vale la pena leer la página de manual de lzma:
fuente
Echa un vistazo a esta entrada de Wikipedia . Hacia el fondo, "Comparación de eficiencia". Le dará un porcentaje de compresión y el tiempo necesario, aproximadamente. Todos esos números variarán (en cuanto a la velocidad) en función de la velocidad de la máquina utilizada, la cantidad de memoria, etc.
Más puntos de referencia de compresión:
fuente
Comparando zip, 7z, rar con dos estuches
Depende de lo que esté comprimiendo exactamente, pero en general 7z hace un mejor uso de múltiples procesadores, y el formato de compresión 7z en sí mismo produce una compresión más alta que zip, y a veces más alta que rar (aunque rar y 7z son casi equivalentes, pero rar isn no es gratis ...)
Mis pruebas hace unos meses dieron estos resultados:
Comprimir un único archivo de base de datos de acceso de 10 MB:
Comprimí una carpeta que contenía más de nueve mil archivos de diferentes tipos (903,488 KB) y obtuve lo siguiente (esta es una combinación de código fuente y todas las herramientas que lo rodean para el software que se está desarrollando):
Para fines de tiempo, esto fue en un Core2 Duo, 2GHz, 1GB de RAM y un disco duro barato.
Entonces 7z dio una mejora sustancial en la relación de compresión en los dos casos que probé más allá de zip, e incluso mejoré en rar, pero 7z fue ciertamente más lento. No significativamente, pero lo suficiente como para ser notado.
-Adán
fuente
Acabo de instalar dar (pero aún no he tenido la oportunidad de jugar con él). Es similar al alquitrán con compresión gzip o bzip2, con la capacidad adicional de dividir el archivo en varias partes y calcular la paridad para que si una o más partes están dañadas, se pueda reconstruir a partir de los archivos de paridad.
fuente