Time Machine, ZFS y deduplicación

8

Actualmente estoy exportando una partición ZFS con el dedup=onuso de ubuntu-zfsy netatalk. Sin embargo, la máquina del tiempo insiste en crear un paquete disperso en él, y me hizo preguntarme si esto tendría algún impacto en la deduplicación, ya que el concepto de "archivos" desaparece, y probablemente la alineación del bloque tampoco sería genial ... .

PD: Toda mi idea de usar dedup es que tengo un par de macbooks haciendo copias de seguridad en el mismo lugar, y muchos de sus archivos son iguales.


Anexo: Parece que la alineación a nivel de bloque está fallando en la deducción. Aquí está mi experiencia:

  • Time-machine copias de dos macbooks diferentes, con muchos datos duplicados entre ellos (total 200Gb)
  • CCC los dos macbooks a dos imágenes dispersas.

Factor de deduplicación? 1.01x


¿Alguna idea sobre cómo configurar ZFS dedup para que funcione correctamente con las copias de seguridad de la máquina del tiempo? ¿Debo comenzar a buscar otras alternativas de respaldo (w / dedup)?

Hugo Sereno Ferreira
fuente
La compresión parece una mejor opción. ¿Podría ser cifrado, sin embargo? Dos archivos cifrados con el mismo contenido pueden "verse" muy diferentes al sistema de archivos que se encuentra debajo debido a cómo funciona el cifrado. Me imagino que dedup funciona bien en volúmenes no encriptados , incluso si es un archivo enorme y no un paquete escaso.
Oleg Lobachev

Respuestas:

7

La deduplicación en ZFS es a nivel de bloque, por lo que no depende del concepto de archivos. La única forma en que se puede vencer la deduplicación es si el desplazamiento de un archivo dentro del sparsebundle no siempre es el mismo módulo que el tamaño del bloque. Dado que ZFS puede usar tamaños de bloque variables que son más grandes que el tamaño de bloque del sistema de archivos HFS + dentro del sparsebundle, no se garantiza la alineación correcta, pero tampoco se garantiza que la deduplicación fallará.

Si le preocupa el espacio, también puede habilitar la compresión en su grupo ZFS. Impone una sobrecarga de CPU adicional, pero en realidad puede aumentar el rendimiento efectivo del disco.

usuario5516
fuente