xz no solo es más lento, sino mucho más lento, el archivo de 300 mb tardó unos 30 segundos en comprimir bzip2. Maté a xz después de haber estado comprimiendo durante más de 5 minutos
Tebe
@ Копать_Шо_я_нашел Creo que depende en gran medida del nivel de compresión que elija. Con -1, no es tan lento, pero con la configuración predeterminada, tiende a ser bastante lento.
glglgl
7
La última actualización de maximumcompression.com es junio de 2011 (respuesta actualizada en octubre de 2015)
Por lo tanto, este sitio web no menciona
el compresor de texto campeón actual en todo el mundo :
Detalles: Byron Knoll se está desarrollando activamente cmixcomo software libre (GPL) desde 2013 basado en el libro Compresión de datos explicado por Matt Mahoney . Matt Mahoney también mantiene algunos de los puntos de referencia anteriores y propone ZPAQ ( WP ), un archivador incremental de línea de comandos.
Si prefiere una herramienta más estándar (que requiere menos RAM), le recomiendo:
lrzipes una evolución de rzippor Con Kolivas . lrzipsignifica dos nombres: Long Range ZIP y Lzma RZIP . lrzipA menudo es mejor que xz(otra herramienta de compresión popular). Alexander Riccio también recomienda lrzip.
El "experto en archivadores" , Matt Mahoney , ha trabajado intensamente en algoritmos PAQ durante diez años y proporciona el mejor compromiso entre los recursos de CPU / memoria y el nivel de compresión.
Sin embargo, la última zpaqversión no suele estar empaquetada / disponible en la distribución reciente :-(
Siempre la compilo desde las fuentes cuando tengo una nueva máquina y necesito un muy buen compresor: https://github.com/zpaq/zpaq
bz2 tiene una compresión más ajustada, el algoritmo tiene más opciones para buscar redundancia para comprimir.
gzip está en muchas más herramientas, y es más multiplataforma. Más herramientas de Windows pueden manejar archivos .gz. Es parte de http, por lo que incluso los navegadores web pueden entenderlo.
En Linux, hay herramientas que le permiten trabajar directamente en archivos comprimidos. zgrep y bzgrep pueden buscar en archivos comprimidos.
Si solo estuviera en Linux, usaría bzip2, para las relaciones de compresión ligeramente mejores.
xz comprime mucho mejor que bz2, pero lleva más tiempo. Entonces, si su objetivo es la compresión máxima y el espacio en su disco duro es muy alto (que es mi caso con una unidad al 98% llena, mientras reorganizo mis sistemas de archivos), y puede activar un script para hacer el trabajo - Tómese un descanso y regrese en 5 minutos.
Unxz es muy rápido para descomprimir en mi experiencia, lo cual es algo bueno para mí a diario.
bz2 es más rápido de comprimir que xz, pero no parece lograr los resultados de compresión de xz.
La única forma de realizar estas evaluaciones es ejecutar puntos de referencia con una combinación de archivos comunes que normalmente comprimiría / descomprimiría, y variará los parámetros para ver cuál sale en primer lugar.
Respuestas:
Normalmente, bz2 tiene una mejor relación de compresión, combinada con mejores características de recuperación.
OTOH, gz es más rápido.
Se dice que xz es incluso mejor que bz2, pero no sé el comportamiento del tiempo.
fuente
-1
, no es tan lento, pero con la configuración predeterminada, tiende a ser bastante lento.La última actualización de maximumcompression.com es junio de 2011 (respuesta actualizada en octubre de 2015)
Por lo tanto, este sitio web no menciona
el compresor de texto campeón actual en todo el mundo :
cmix
Competiciones / Benchmarks:
18.2% de compresión del archivo de texto de 1 MB enwik6
17.6% de compresión de los 14 archivos del corpus de Calgary (archivo tar de 3GB)
15.7% de compresión del archivo de texto de 100MB enwik8
(pero
cmix
no es el ganador porque requiere demasiada RAM, más de 20GB)15.7% de compresión del corpus Silesia de 202MB
12.4% de compresión del archivo de texto de 1GB enwik9
Detalles:
Byron Knoll se está desarrollando activamente
cmix
como software libre (GPL) desde 2013 basado en el libro Compresión de datos explicado por Matt Mahoney . Matt Mahoney también mantiene algunos de los puntos de referencia anteriores y propone ZPAQ ( WP ), un archivador incremental de línea de comandos.Si prefiere una herramienta más estándar (que requiere menos RAM), le recomiendo:
lrzip
lrzip
es una evolución derzip
por Con Kolivas .lrzip
significa dos nombres: Long Range ZIP y Lzma RZIP .lrzip
A menudo es mejor quexz
(otra herramienta de compresión popular).Alexander Riccio también recomienda
lrzip
.Mi favorito es:
zpaq
El "experto en archivadores" , Matt Mahoney , ha trabajado intensamente en algoritmos PAQ durante diez años y proporciona el mejor compromiso entre los recursos de CPU / memoria y el nivel de compresión.
Sin embargo, la última
zpaq
versión no suele estar empaquetada / disponible en la distribución reciente :-(Siempre la compilo desde las fuentes cuando tengo una nueva máquina y necesito un muy buen compresor: https://github.com/zpaq/zpaq
fuente
Tal vez podría echar un vistazo a esos puntos de referencia , especialmente la parte que prueba la compresión de los archivos de registro .
fuente
Yo he hecho un punto de referencia para la prueba para comprimir el siguiente:
carpeta de 204 MB (con archivos html) 1600
resultados
así que el 7zip es el mejor de ellos, puedes obtenerlo aquí
http://www.7-zip.org/
fuente
bz2 tiene una compresión más ajustada, el algoritmo tiene más opciones para buscar redundancia para comprimir.
gzip está en muchas más herramientas, y es más multiplataforma. Más herramientas de Windows pueden manejar archivos .gz. Es parte de http, por lo que incluso los navegadores web pueden entenderlo.
En Linux, hay herramientas que le permiten trabajar directamente en archivos comprimidos. zgrep y bzgrep pueden buscar en archivos comprimidos.
Si solo estuviera en Linux, usaría bzip2, para las relaciones de compresión ligeramente mejores.
fuente
xz comprime mucho mejor que bz2, pero lleva más tiempo. Entonces, si su objetivo es la compresión máxima y el espacio en su disco duro es muy alto (que es mi caso con una unidad al 98% llena, mientras reorganizo mis sistemas de archivos), y puede activar un script para hacer el trabajo - Tómese un descanso y regrese en 5 minutos.
Unxz es muy rápido para descomprimir en mi experiencia, lo cual es algo bueno para mí a diario.
bz2 es más rápido de comprimir que xz, pero no parece lograr los resultados de compresión de xz.
La única forma de realizar estas evaluaciones es ejecutar puntos de referencia con una combinación de archivos comunes que normalmente comprimiría / descomprimiría, y variará los parámetros para ver cuál sale en primer lugar.
fuente