Conozco gzip desde hace años, recientemente vi que bzip se usaba en el trabajo. ¿Son básicamente equivalentes, o hay ventajas y desventajas significativas para uno de ellos sobre el otro?
compression
gzip
bzip2
ripper234
fuente
fuente
Respuestas:
Gzip y bzip2 son funcionalmente equivalentes. (Había una vez un bzip, pero parece haberse desvanecido por completo de la faz del mundo). Otros formatos de compresión comunes son zip, rar y 7z; estos tres realizan compresión y archivado (empaquetan múltiples archivos en uno). Aquí hay algunas clasificaciones típicas en términos de velocidad, disponibilidad y relación de compresión típica (tenga en cuenta que estas clasificaciones son algo subjetivas, no las tome como un evangelio):
Como puede ver, no hay un ganador claro. Si desea confiar en programas que probablemente ya estén instalados, use zip en Windows (o, si es posible, archivos autoextraíbles, ya que Windows no incluye ninguno de estos) y gzip en unix. Si desea una compresión máxima, use 7z.
Rar también tiene el inconveniente de que, hasta donde yo sé, no existe un software gratuito que cree archivos rar o que pueda descomprimir todos los archivos rar. Los otros formatos tienen implementaciones gratuitas y sin reclamos de patentes (serios).
fuente
bzip
desapareció porque estaba usando la codificación algorítmica patentada. Debido a la patente, fue rediseñado para utilizar la codificación Huffman en su lugar. Durante este rediseño, se agregaron nuevas características y mejoras. Sin embargo, lo fundamental que lo convierte en un algoritmo de compresión único, la transformación Burrows – Wheeler, se mantuvo igual en ambas versiones.Por lo que puedo decir, gzip es en general más rápido, mientras que bzip en general produce una mejor compresión (más pequeña).
fuente
Los algoritmos tienen diferentes compensaciones de tiempo, memoria y espacio. Tenga en cuenta que estos algoritmos se escribieron hace bastante tiempo y su teléfono inteligente tiene muchas más CPU que las computadoras de escritorio de esos días.
Su elección es entre universalidad (.gz) y un poco más de compresión (.bz2). Solo tú puedes decir cuál te interesa más.
Una ventaja de .gz es que puede comprimir una secuencia, una secuencia donde no puedes mirar hacia atrás. Esto lo convierte en el compresor oficial de transmisiones http. Necesitaba usar gzip una vez por eso, pero es poco probable que tengas que pensarlo.
fuente
Aquí hay una lista de sitios que prueban algoritmos de compresión, para encontrar solo bzip y gzip tendrá que cavar un poco, pero la mayoría de los sitios enumerarán las características de los algoritmos. De esta manera, puede comparar lo que es importante para usted, tamaño (relación de compresión), tiempo, memoria, CPU.
http://www.maximumcompression.com/benchmarks/benchmarks.php
fuente
En mi experiencia, bzip ha ofrecido consistentemente mejores relaciones de compresión que gzip. Además, con 7zip como administrador y algoritmo bzip, 7zip puede utilizar procesadores de múltiples núcleos.
fuente
Según http://tukaani.org/lzma/benchmarks.html , gzip comprime el doble de rápido que bzip2 y descomprime diez veces más rápido.
Por ejemplo, para usar con el almacenamiento en caché s3, en travis, etc., donde desea velocidad de compresión / descompresión, no solo en tamaños pequeños, gzip podría ser una buena compensación.
fuente