¿Cómo afecta el "tamaño de palabra" a la compresión?

24

En 7 Zip al agregar una carpeta a un archivo existe la opción de cambiar el Tamaño de Word.

¿Cómo afecta el tamaño de esta palabra a la compresión, en particular al tamaño final del zip?

Noté que cambiar el nivel de compresión aumenta el tamaño de la palabra, sin embargo, incluso en ultra, solo selecciona un tamaño de palabra de 128, aunque la opción más grande es más del doble. ¿Hay alguna razón por la cual ultra no selecciona la más grande? ¿Es el tamaño de compresión óptimo en algún lugar entre el tamaño de palabra más grande y más pequeño?

Aequitas
fuente
Vea lo que Shell dice en esta publicación sobre parte de sus preguntas aquí -> The Post .
Pimp Juice IT
@LMFAO_A_JOKE que solo dice que para algunos archivos superiores es mejor a veces no
Aequitas
1
Esto no responde a todas sus preguntas con gran detalle, pero para la pregunta UNO de -> How does this word size affect compression, in particular the final size of the zip?Creo que la parte posterior de la publicación WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.le brinda una explicación de la PARTE de su conjunto de preguntas. Es por eso que solo puse esto aquí para hacer un comentario y NO respondí, ¡solo trato de darte algo!
Pimp Juice IT
¿Qué significa la última oración, Tamaño del archivo ... no monotónicamente?
Aequitas
1
Creo que esto significa que el tamaño del archivo será más pequeño (disminuyendo en tamaño del tamaño original más) "típicamente" con el mayor valor de WordSize, pero "depende" de la compresibilidad de los tipos de datos que se están comprimiendo, como el texto a diferencia de los archivos de imagen tal vez como un ejemplo. La sugerencia fue probar los diferentes valores para obtener el valor más óptimo para sus datos, aunque para saber que elige las mejores opciones para satisfacer sus necesidades.
Pimp Juice IT

Respuestas:

8

Realmente depende de los datos que está comprimiendo y del algoritmo utilizado.

Tamaño de la palabra

Ingrese la longitud de las palabras, que se utilizarán para encontrar secuencias idénticas de bytes para la compresión. Para LZMA, el tamaño de palabra grande generalmente proporciona una relación de compresión un poco mejor y un proceso de compresión más lento. El parámetro de gran tamaño de palabra puede aumentar significativamente la relación de compresión en caso de que los archivos contengan secuencias largas e idénticas de bytes. Para PPMd, el tamaño de la palabra tiene un gran significado. Afecta fuertemente tanto la relación de compresión como la velocidad de compresión / descompresión.

Hay algunas comparaciones aquí.

Hefewe1zen
fuente
3
aquí está la página archivada web.archive.org/web/20180820055912/https://www.dotnetperls.com/…
phuclv