Fallas del disco duro en dos servidores domésticos

0

Tengo dos PC viejas que actualmente ejecutan Ubuntu Server 12.04 LTS en casa y ambas parecen tener fallas de HDD de vez en cuando. El problema es el mismo en ambos, el sistema entra en modo de solo lectura, a veces se bloquea por completo y tengo que reiniciar las máquinas para que vuelva a la normalidad. Al reiniciar, recibo un error que dice algo acerca de la falla del disco duro y desea "solucionar" el problema, sin embargo, pasa por ese paso de "reparación", arranca el sistema y luego está bien durante unos días, luego boom, crash de nuevo.

Probablemente vale la pena mencionar que he reinstalado Ubuntu 12.04 LTS en ambos sistemas dos veces sin suerte. No creo que esto esté relacionado con HDD, ya que esto ocurre en ambas máquinas. Una es una PC vieja y la otra es mi computadora portátil anterior (si necesita especificaciones, por favor dígame) La primera es de 32 bits y la segunda es de 64 bits, y he instalado la arquitectura correcta de ubuntu . Soy bastante nuevo en Linux, busqué en Google, busqué en toda la web y no puedo encontrar nada sobre esto que pueda ayudarme a resolver el problema.

Estos son algunos de los errores relevantes (en mi opinión) en el registro dmesg (Ambas máquinas tienen lo mismo, si necesita el archivo de registro dmesg completo de ambas máquinas, dígame):

[    2.239578] ata3.00: ATA-7: Hitachi HDT725025VLA380, V5DOA58A, max UDMA/133
[    2.245936] ata3.00: 488397168 sectors, multi 0: LBA48 NCQ (depth 31/32), AA
[    2.253166] ata3.00: configured for UDMA/133
[    2.272299] sd 3:0:0:0: [sda] 488397168 512-byte logical blocks: (250 GB/232 GiB)
[    2.285467] sd 3:0:0:0: Attached scsi generic sg0 type 0
[    2.285537] sd 3:0:0:0: [sda] Write Protect is off
[    2.285541] sd 3:0:0:0: [sda] Mode Sense: 00 3a 00 00
[    2.285576] sd 3:0:0:0: [sda] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
[    3.241596] EXT4-fs (sda1): INFO: recovery required on readonly filesystem
[    3.248461] EXT4-fs (sda1): write access will be enabled during recovery
[    3.725449] EXT4-fs (sda1): recovery complete
[    3.752546] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
[    5.794220] init: ureadahead main process (287) terminated with status 5
[    7.288860] Adding 2094076k swap on /dev/sda5.  Priority:-1 extents:1 across:2094076k FS
[    9.660321] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro

EDITAR : Se encontraron 2 líneas en boot.log que también podrían ser relevantes:

fsck from util-linux 2.20.1
/dev/sda1: clean, 110596/15138816 files, 1810722/60525568 blocks

EDITAR : Aquí están los resultados de smartctl -A / dev / sda

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   001   016    Pre-fail  Always   In_the_past 1
  2 Throughput_Performance  0x0005   158   100   050    Pre-fail  Offline      -       211
  3 Spin_Up_Time            0x0007   123   100   024    Pre-fail  Always       -       295 (Average 314)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       2448
  5 Reallocated_Sector_Ct   0x0033   001   001   005    Pre-fail  Always   FAILING_NOW 509 (0, 382)
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   132   100   020    Pre-fail  Offline      -       33
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       28704
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1164
192 Power-Off_Retract_Count 0x0032   098   098   000    Old_age   Always       -       2655
193 Load_Cycle_Count        0x0012   098   098   000    Old_age   Always       -       2655
194 Temperature_Celsius     0x0002   142   122   000    Old_age   Always       -       42 (Min/Max 13/49)
196 Reallocated_Event_Count 0x0032   087   087   000    Old_age   Always       -       390
197 Current_Pending_Sector  0x0022   021   021   000    Old_age   Always       -       1517
198 Offline_Uncorrectable   0x0008   079   079   000    Old_age   Offline      -       531
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0
Sven
fuente
... y no se te ha ocurrido que un par de discos duros en máquinas "viejas" en casa podrían estar teniendo problemas? ¿Porque eso?
HopelessN00b
Sí, seguramente me ha ocurrido. Pero recientemente cambié de Windows Server 2008 a Ubuntu en uno de ellos y no tuvo ningún problema durante ese tiempo. Sin embargo, la segunda máquina (la computadora portátil ...) es bastante nueva.
Sven
Publicó una gran cantidad de mensajes relacionados con su tarjeta de video . Deberá publicar algo relevante para su disco duro, como la smartctl -Asalida.
Michael Hampton
Bien, ahora agregué la salida de smartctl a la pregunta principal.
Sven

Respuestas:

0

Los sistemas de archivos frecuentemente hacen esto en errores de hardware relacionados con el disco. El culpable habitual son los bloques defectuosos, aunque el reallocated_sector_count podría ser otra cosa. De cualquier manera, evitaría usar fdisk e intentaría ddrescucutar su disco a un disco nuevo, puede encontrar instrucciones bastante buenas aquí: http://www.forensicswiki.org/wiki/Ddrescue - no hace falta decir que asegúrese de tener El nombre correcto del dispositivo. Si obtiene el uuid del disco visitando / dev / disk / by-uuid antes de intentar copiar los datos en una nueva unidad, puede estar seguro de que no sobrescribirá accidentalmente sus datos con un disco en blanco debido al funcionamiento sistema reordenando las unidades (lo que sucede a veces).

Un poco de nerd de Linux
fuente
Muy bien, reemplazaré el disco por otro y veré si funciona. Volveré a publicar con resultados en unos días.
Sven