Tengo una computadora portátil con Maverick (muy feliz hasta ayer), con un SSD Patriot Torx; Cifrado LUKS de toda la partición; un volumen físico lvm encima de eso; luego home y root en volúmenes lógicos ext4 además de eso.
Cuando intenté arrancarlo ayer, se quejó de que no podía montar el sistema de archivos raíz. Ejecutando fsck, básicamente cada inodo parece estar equivocado. Tanto los sistemas de archivos de inicio como de raíz muestran problemas similares. Comprobar un superbloque de respaldo no ayuda.
e2fsck 1.41.12 (17-May-2010)
lithe_root was not cleanly unmounted, check forced.
Resize inode not valid. Recreate? no
Pass 1: Checking inodes, blocks, and sizes
Root inode is not a directory. Clear? no
Root inode has dtime set (probably due to old mke2fs). Fix? no
Inode 2 is in use, but has dtime set. Fix? no
Inode 2 has a extra size (4730) which is invalid
Fix? no
Inode 2 has compression flag set on filesystem without compression support. Clear? no
Inode 2 has INDEX_FL flag set but is not a directory.
Clear HTree index? no
HTREE directory inode 2 has an invalid root node.
Clear HTree index? no
Inode 2, i_size is 9581392125871137995, should be 0. Fix? no
Inode 2, i_blocks is 40456527802719, should be 0. Fix? no
Reserved inode 3 (<The ACL index inode>) has invalid mode. Clear? no
Inode 3 has compression flag set on filesystem without compression support. Clear? no
Inode 3 has INDEX_FL flag set but is not a directory.
Clear HTree index? no
....
Al correr strings
por los sistemas de archivos, puedo ver que hay nombres de archivos y datos de usuarios. Tengo copias de seguridad lo suficientemente buenas (toque madera) que no vale la pena moverse para recuperar archivos individuales, aunque podría guardar una imagen del disco sin cifrar antes de reconstruir, por si acaso.
smartctl
no muestra ningún error, tampoco lo hace el registro del núcleo. Ejecutar un modo de escritura badblocks
en el intercambio lv tampoco encuentra problemas. Por lo tanto, el disco puede estar fallando, pero no de una manera obvia.
En este punto estoy básicamente, como dicen, ¿jodido? Volver a la reinstalación, ¿tal vez ejecutar bloques defectuosos en el disco y luego restaurar desde la copia de seguridad? Ni siquiera parece haber suficientes datos para presentar un error significativo ...
No recuerdo que esta máquina se estrelló la última vez que la usé.
En este punto, sospecho que un error o corrupción de memoria causó que escribiera basura en los discos cuando se ejecutó por última vez, o algún tipo de modo de falla sutil para el SSD.
¿Qué crees que habría causado esto? ¿Hay algo más que intentes?
He visto esto antes. Es algo que ver con Ubuntu 10.10. Miraba a mi alrededor en el rastreador de errores ya que ha sido publicado varias veces. Para estar seguro, tome una instantánea del disco, límpielo y luego suéltelo en un sistema secundario para ver si el error se repite (para descartar el disco - culpable poco probable).
fuente
Actualización: Eventualmente, me convencí de que el problema era algún tipo de falla SSD complicada, o supongo que posiblemente una interacción entre el núcleo y la SSD. Lo reemplacé con un disco magnético y no he tenido problemas nuevamente.
fuente