En general, he observado lo siguiente:
- Uso de archivos y herramientas Linux y. bzip2 o gzip para la distribución de archivos
- Los archivos o herramientas de Windows-y usan ZIP para distribuir archivos
- Muchas personas usan 7-Zip Para crear y distribuir sus propios archivos.
Preguntas:
- ¿Cuáles son las ventajas y desventajas de estos formatos, todos los cuales parecen ser formatos abiertos? ¿Cuándo / por qué debería elegir uno (digamos, 7-Zip) sobre otro (digamos, ZIP)?
- ¿Por qué la tendencia anterior parece mantenerse, aunque todos estos son formatos portátiles? ¿Hay alguna ventaja en particular al usar un formato de archivo en particular en una plataforma en particular?
Respuestas:
Hay una gran variedad de formatos y métodos de compresión disponibles, algunos no se comprimen en absoluto y están diseñados para almacenar una cantidad de archivos en un archivo, y otros compresores experimentales más nuevos ( PAQ están diseñados para comprimir de la manera más agresiva posible, independientemente del tiempo que lleve realizar dicha operación.
Debe evaluar las características que necesita de su elección de método de compresión y también considerar el contexto en el que se utilizará.
Las diferentes características y consideraciones incluyen:
Generalmente hablando cremallera es el formato más omnipresente, pero los tamaños de más de 4 GB generalmente no son compatibles (si es que lo hacen), el soporte de seguridad generalmente se considera pobre (la contraseña estándar se puede comprometer con un ataque de texto sin formato y el cifrado adicional generalmente se implementa como un derivado no oficial del formato por parte de los proveedores comerciales de software ZIP).
Además, la mayoría de los formatos populares tendrán algún tipo de soporte en todos los sistemas operativos al instalar más software.
Mi elección personal es 7-Zip , ya que tiene gran compresión y flexibilidad; A pesar de tener una interfaz de usuario peculiar en Windows. Hay descompresores para Linux y Mac OS X (aunque no están basados en GUI como estándar).
fuente
Una cosa que me viene a la mente es una publicación en el blog (de dos años) de Jeff Atwood: Compresión de archivos en la era de múltiples núcleos . En ese artículo, encuentra que bzip2 supera a 7-zip cuando ejecuta más de dos núcleos.
fuente
Para su primera pregunta, 7-Zip es un archivador que puede usar muchos algoritmos para comprimir y descomprimir datos.
Para su segunda pregunta, solo asegúrese de que la plataforma admita herramientas que admitan el formato dado. Por ejemplo, evitaría usar RAR en una Mac. Si bien es posible utilizarlo, y existen utilidades gratuitas que lo admiten, carecen de la interfaz mucho más rica que las utilidades de Windows que admiten RAR (en mi experiencia).
fuente
Como han mencionado otros, la elección de un formato de compresión particular depende en gran medida del uso y la audiencia prevista.
Los archivos .tar.gz y tar.bz2 son ideales para su uso en sistemas Linux (y por extensión para compartir archivos con usuarios de Linux) porque las herramientas tar, gzip y bzip2 son en gran parte ubicuas en la plataforma, y porque el formato .tar está completo Soporte para permisos Unix y otras propiedades específicas de la plataforma. La elección entre gzip y bzip2 para comprimir el archivo tar es principalmente una decisión sobre la relación velocidad / compresión, ya que bzip2 entrega archivos más pequeños pero con una velocidad de compresión mucho menor. Las desventajas de estos formatos incluyen una menor compatibilidad con Windows y la necesidad (potencial) de descomprimir todo el archivo para extraer un solo archivo.
Los archivos ZIP se pueden extraer en la mayoría de las plataformas utilizando herramientas nativas, por lo que es una opción ideal para enviar un archivo a un usuario no técnico que no se sentiría cómodo con la instalación de software de archivo de terceros, como 7-Zip. El nivel de compresión no es tan bueno como los algoritmos más avanzados y no admite los permisos de Unix, pero es un formato excelente si desea enviar un archivo de fotos de vacaciones a su abuela, por ejemplo. ZIP también proporciona cierta protección de contraseña básica y puede extraer rápidamente un archivo desde cualquier lugar del archivo.
7-Zip es bueno si quieres las mejores relaciones de compresión posibles. Al igual que ZIP, no es compatible con los permisos o la propiedad de los archivos Unix, y tampoco está instalado de manera predeterminada en la mayoría de las plataformas, lo que hace que sea un poco más fácil de usar, pero puede valer la pena en Windows si la relación de compresión es importante. En un entorno totalmente Linux, sería mejor usar las herramientas de compresión 'xz' o 'lzma' junto con tar, que funcionan exactamente de la misma manera que 'gzip' y 'bzip2' pero usan el algoritmo LZMA más avanzado como 7 -Cremallera.
fuente
A modo de ejemplo, uso los formatos mencionados en estos casos:
Evito RAR por completo y cada vez que recibo el archivo RAR de alguien que conozco, le digo que deje de usar ese formato ya que es propietario, y que probablemente esté usando un software sin licencia (la mayoría de la gente descarga la versión de prueba de WinRAR y la sigue usando para siempre) .
PD: ejecuto Ubuntu (principalmente) y Windows (tanto arranque dual como VirtualBox).
fuente
Hay al menos cuatro trabajos separados que a menudo se confunden entre sí porque las herramientas populares los integran:
La ubicuidad de .tar.gz y .tar.bz corresponde a la filosofía de Unix de las herramientas pequeñas que hacen un solo trabajo bien, sobre una herramienta única que hace todo. El formato de archivo TAR no es compatible con la compresión o el cifrado, pero puede ser comprimido aún más por cualquier compresor (incluso como .tar.zip o .tar.7z). El trabajo de GZip y BZip2 es simplemente comprimir un flujo de archivos a otro flujo de archivos, la capa de compresión no necesita preocuparse de cómo preservar los metadatos, el cifrado o la suma de comprobación. Con el tiempo, sin embargo, varios atajos se han hecho en
tar
Programa para trabajar con un compresor más convenientemente.En formato de archivo zip y 7z, estos trabajos separados son realizados por un solo programa en un solo formato de súper archivo.
Debido a que ha sido así, los códigos fuente del programa se distribuyen tradicionalmente como .tar.gz o .tar.bz2, porque la conservación de los permisos de los archivos, el tiempo de modificación, etc. son importantes para varias herramientas utilizadas para la programación (por ejemplo, make).
El paso separado de compresión y archivo ha funcionado muy bien durante años, tiene una clara ventaja de poder mezclar y combinar libremente el archivo y la compresión, y su desventaja (un proceso de compresión de 2 pasos) se puede evitar fácilmente desarrollando herramientas más inteligentes ( el programa de compresión más moderno de Linux se comprime directamente a .tar.gz o .tar.bz2, ocultando el paso intermedio).
No hay una razón sólida para pasar a otros formatos de archivo, los compresores más nuevos no tienen una tasa de compresión significativamente mejor para justificar la ruptura de la tradición y el tar puede preservar todo lo suficientemente bien.
fuente