Algoritmo de destructor de archivos

8

Como parte de la programación del sistema de aprendizaje, estoy buscando implementar una destructora de archivos. La forma más simple (y probablemente visto como ingenuo) sería reemplazar los bytes de datos con ceros (sé que el sistema operativo divide los archivos y reemplazaré los bytes en todos esos fragmentos). Pero cuando busco en Google sobre este tema, me sorprende encontrar algoritmos de pasadas múltiples, ¡algunos llegan hasta 35!

¿Podría alguien aclarar el beneficio del pase múltiple, por favor? No pude encontrar ninguna explicación.

Gracias

Miguel
fuente
1
Es posible que desee leer esto: stackoverflow.com/questions/4448772
Blrfl

Respuestas:

14

Imagine un disco físico que almacena el valor binario 0101. Físicamente, en el disco, las cargas existen como valores reales, que el controlador del disco redondea hacia arriba o hacia abajo.

binario -> carga física

0 1 0 1 -> 0.1 0.9 0.1 0.9

Si sobrescribiera los datos con ceros, quedaría algo de carga residual de los valores anteriores, por lo que podría en este ejemplo simple, siendo los nuevos valores

binario -> físico

0 0 0 0 -> 0.01 0.09 0.01 0.09

El equipo que es lo suficientemente sensible como para leer estos cargos en alta resolución, se puede utilizar para extraer esta "sombra" de los datos sobrescritos. Es por eso que reescribir varias veces (y usar valores aleatorios) ayuda a ocultar los datos.

pez globo
fuente
-1, no, no lo es. Hemos estado poniendo límites a los discos durante tanto tiempo que hemos entrado sin ambigüedades en el dominio de la física cuántica. Esta suposición analógica simplemente ya no es válida. Cada dominio magnético (grano) en un plato apunta en una dirección, y solo en una. Solo hay unos pocos cientos de granos por bit, están fuertemente acoplados y no se enfrían en absoluto. Además, los bits reales se transforman mediante una función PRML y ECC, por lo que ni siquiera puede decir directamente a qué bit corresponde un grano individual. Esencialmente, los discos de 1TB + son posibles porque este residuo ahora se usa completamente.
MSalters
3
@MSalters: está asumiendo que todos los discos en uso son así. WD todavía hace discos que no utilizan esto. La pregunta era por qué usar 35 pases. Es para ocultar los datos por las razones que se muestran. Hasta que las unidades de estilo antiguo ya no estén en uso, entonces se necesita este tipo de destructor. Lo que falta es que los nuevos controladores no le dan el control de grano fino sobre el hardware. Las leyes diseñadas para evitar la destrucción de evidencia han llevado a los controladores que no sobrescriben las áreas utilizadas anteriormente hasta que no tengan otra opción.
SoylentGray
44
@MSalters, si es necesario es irrelevante. Esta es la respuesta correcta a la pregunta planteada por el OP .
Caleb
@MSalters, sí, todo el grano apunta en una dirección, pero el eje de cuantización puede diferir de grano a grano, lo que induce alguna variación. Esto se vería afectado por fluctuaciones térmicas, fluctuaciones magnéticas del cabezal de lectura que pasa o un grano vecino volteado.
rcollyer
@Chad: Todos los materiales magnéticos tienen granos. Las matemáticas simples demuestran que los discos de WD usan unos cientos de granos por bit, dado el tamaño y la capacidad de sus platos. Puede que te confundan los medios estampados. Esos delinean intencionalmente los granos para reducir el acoplamiento. Los medios sin patrones solo tienen granos distribuidos al azar.
MSalters
7

El borrado multipass es necesario para destruir datos en dispositivos de almacenamiento magnético. Los datos se pueden recuperar con el equipo adecuado, incluso si se sobrescribió con otra secuencia de 1s y 0s de las capas inferiores o intermedias.

Sin embargo, hay voces en Internet que afirman que el borrado de múltiples pasos ya no es necesario, ya que la densidad de área de los datos en los discos duros modernos se ha multiplicado por 10 000.

Halcón
fuente
1
De nada. Lástima que todavía no tienes el privilegio de votar =)
Falcon
0

Se dice que los expertos con equipos especiales pueden reconstruir una unidad formateada. Por lo tanto, el consejo es sobrescribir los datos en el disco varias veces con diferentes patrones (aleatorios).

Ingo
fuente
0

La sobrescritura de datos con 0s en múltiples pasadas solo tiene sentido para dispositivos de almacenamiento magnético, debido a lo que dijo @pufferfish. Para SSD y otros mecanismos de almacenamiento flash, esto falla, consulte http://www.usenix.org/events/fast11/tech/full_papers/Wei.pdf

Moraleja de la historia: el problema del hardware en el software puede cambiar cuando la tecnología del hardware cambia, aunque la API no cambiará.

Residuo
fuente