He visto algunos archivos muy comprimidos, como 700 MB de datos comprimidos a unos 30-50 MB.
Pero, ¿cómo se obtienen esos archivos comprimidos? He intentado usar software como WinRAR y 7Zip, pero nunca he logrado una compresión tan alta.
¿Cuáles son las técnicas / software que le permiten comprimir archivos tan bien?
(PD: estoy usando Windows XP)
compression
rzlines
fuente
fuente
Respuestas:
Si el tiempo necesario para comprimir los datos no es un problema, puede optimizar el tamaño comprimido utilizando varias herramientas diferentes juntas.
Comprima los datos varias veces utilizando diferentes herramientas como 7zip, winrar (para zip) y bjwflate.
(Tenga en cuenta que esto no significa comprimir el archivo zip una y otra vez, sino crear una cantidad de archivos zip alternativos utilizando diferentes herramientas)
A continuación, ejecute deflopt en cada archivo para reducir cada archivo un poco más.
Finalmente, ejecute zipmix en la colección de archivos. Dado que diferentes herramientas zip son mejores en diferentes archivos, zipmix selecciona la mejor versión comprimida de cada archivo de cada uno de los archivos y produce una salida que es más pequeña que cualquiera de las herramientas zip que podrían haber producido individualmente.
Sin embargo, debe tener en cuenta que esto no garantiza que funcione ningún tipo de magia en sus archivos. Ciertos tipos de datos simplemente no se comprimen muy bien, como JPEG y MP3. Estos archivos ya están comprimidos internamente.
fuente
Esto depende completamente de los datos que se comprimen.
El texto se comprime muy bien, los formatos binarios no tan bien y los datos comprimidos (mp3, jpg, mpeg) no lo son en absoluto.
Aquí hay una buena tabla de comparación de compresión de wikipedia.
fuente
¡Las respuestas anteriores son incorrectas en un orden de magnitud!
El mejor algoritmo de compresión con el que tengo experiencia personal es paq8o10t (consulte la página zpaq y el PDF ).
Sugerencia: el comando para comprimir archivos_o_carpetas sería como:
Fuente: utilidad de copia de seguridad de diario incremental y archivador
Puede encontrar un espejo del código fuente en GitHub .
Un algoritmo de compresión un poco mejor, y ganador del Premio Hutter , es decomp8 (ver enlace en la página del premio). Sin embargo, no hay ningún programa de compresor que pueda usar realmente.
Para archivos realmente grandes, lrzip puede lograr relaciones de compresión que son simplemente cómicas .
Un ejemplo de README.benchmarks:
fuente
Squeezechart.com contiene comparaciones de varias tasas de compresión. Aunque, como lo indica la respuesta de Nifle, es poco probable que obtenga tasas de compresión tan altas para formatos binarios.
fuente
La mayoría de las herramientas de compresión tienen configuraciones que le permiten lograr una tasa de compresión más alta con un compromiso de tiempos de compresión / descompresión más lentos y más uso de RAM.
Para 7-Zip, busque "Agregar al cuadro de diálogo de archivo" en la ayuda integrada para obtener más detalles.
fuente
Puede probar 7zip con la siguiente configuración ultra:
fuente
Simplemente consulte el Resumen de las pruebas de referencia de compresión de archivos múltiples que tiene la mejor lista de compresión que consiste en la referencia de compresión completa.
Top 30
fuente
Su mejor apuesta aquí parece ser prueba y error. Pruebe todas sus técnicas de compresión disponibles en cada archivo y elija el mejor para poner en su sitio web. Afortunadamente, las computadoras hacen este tipo de cosas bastante rápido y no se aburren. Podría escribir un script simple para automatizar el proceso para que sea "relativamente indoloro".
Simplemente no esperes milagros: 700 mb hasta 30 mb simplemente no sucede con tanta frecuencia. Archivos de registro como se mencionó anteriormente: sí. "Su archivo promedio" - de ninguna manera.
fuente
Nanozip parece tener la compresión más alta junto con FreeArc. Pero aún no está en la versión final. Hay una buena compresión que logra Nanozip . Tiene una compresión muy alta y no lleva demasiado tiempo, consulte el Resumen de las pruebas de referencia de compresión de múltiples archivos , pero FreeArc es más rápido.
fuente