¿Cómo se implementa la redundancia en la compresión y cómo me beneficio?
Supongo que consiste en algo como almacenar las tablas de búsqueda dos veces para que un solo defecto no invalide todo el resto del archivo. Con respecto al caso de uso, ¿posiblemente al almacenar el archivo en un CD que se rasca ligeramente?
Sin embargo, personalmente nunca obtuve ningún beneficio al agregar redundancia a los archivos zip, y tiendo a omitirlos, por lo que me preguntaba si realmente son útiles en la práctica.
Respuestas:
Creo que estás hablando del algoritmo adaptativo LZ. No se conoce como redundancia debido a todo lo que se duplica en el proceso de construcción del archivo zip. El término proviene de cómo funciona este método de compresión.
Para ilustrar, aquí hay un ejemplo. Digamos que tenía un documento que contenía la frase:
Si quisiera acortar esta frase a través de la redundancia, primero haría un diccionario que contenga todas las palabras que se repitieron, como así
Y luego reescribiría la oración como
Si luego quiero comprimirlo más, puedo agregar lo siguiente a mi diccionario:
Para que se convierta
Como puede ver, cuantas más verificaciones de redundancia atraviese, mayor será la compresión. Pero también está aumentando la probable capucha de corrupción. Esto se debe a que a medida que el diccionario crece, se vuelve más propenso a sufrir daños y si alguna parte del diccionario se daña, el resto no se puede leer.
fuente