Controlador RAID de Intel que no puede diagnosticar un disco defectuoso

1

En mi sistema (con Windows 7 x64) tengo una placa madre Asus Z87 Deluxe, con un controlador Intel RAID incorporado; Mi configuración incluye un disco SSD Kingston de 240 GB para el sistema operativo y dos unidades de disco duro Western Digital de 4TB para datos. Compré dos discos de datos a propósito para reflejarlos, porque quiero minimizar el riesgo de pérdida de datos en este sistema. Todos los discos son SATA 6.0 Gbit / seg.

Configuré los dos discos como una matriz RAID 1 utilizando el controlador Intel integrado, y el sistema se ha ejecutado con esta configuración por un tiempo; sin embargo, siempre ha sido terriblemente lento, y luché con él durante casi un año, antes de finalmente romper el RAID y reconfigurar el controlador para el acceso estándar al disco, para poder solucionar esa increíble lentitud (la herramienta de diagnóstico WD no puede para hablar con un disco RAID, necesita acceso directo a los discos físicos).

Tan pronto como rompí el RAID, muchos errores de disco comenzaron a aparecer en el registro de eventos del sistema, y ​​la herramienta de diagnóstico WD descubrió de inmediato que uno de los discos estaba defectuoso; aún está en garantía, por lo que llamé a WD para un reemplazo que se está enviando actualmente. El otro disco está bien, por lo tanto, no hubo pérdida de datos.

Sin embargo, hay un gran problema aquí: el sistema ha estado funcionando durante casi un año con un disco defectuoso y no solo El controlador Intel RAID no pudo diagnosticar esto por completo , pero en realidad también empeoró la situación por ocultando los errores de disco del sistema operativo , que no tenía forma de saber que un disco estaba fallando.

En el transcurso de este año problemático, probé todas las versiones liberadas del software Intel RAID ( Rapid Storage Technology ); ninguno de ellos cambió este comportamiento ni trajo ninguna mejora en el rendimiento (que asumí que fue causada por la configuración RAID o el controlador, y no por un disco defectuoso, del cual no tenía conocimiento).

¿Por qué el controlador no pudo diagnosticar un disco era defectuoso?
¿Y cómo puedo asegurarme de que realmente me avise si un disco falla, si lo configuro nuevamente para el modo RAID?

Massimo
fuente
Sin más información sobre el fallo particular de la unidad, no veo cómo se puede explicar esto.
Ramhound
Windows está lanzando errores a la izquierda y la derecha en su registro de eventos del sistema; cosas como el evento 11 y 52 de Atapi, el evento 11, 15 y 51 del disco, e incluso el evento 1 de DiskDiagnostic ("SMART dice que el disco está fallando, cámbielo lo antes posible"). Además, el BIOS advierte sobre el mal estado SMART del disco en cada inicio, y la herramienta de diagnóstico WD dice "esta unidad está tan rota que ni siquiera puedo completar mis pruebas".
Massimo
Pero todo esto, solo. después deshabilitar RAID en el controlador; mientras ese disco estaba en una matriz RAID, todo esto era oculto desde el sistema operativo, y el software RAID nunca se molestó en diagnosticar este desorden o advertir sobre lo que estaba sucediendo.
Massimo
Dice más que "la unidad está fallando" ¿qué atributos está fallando exactamente?
Ramhound
Atributo 1, Raw Read Error Rate.
Massimo

Respuestas:

0

Si siempre fue extremadamente lento, entonces una de las unidades originales probablemente estaba defectuosa desde el principio. Lo que significa que ha estado ejecutando un espejo en un estado degradado. Esto debería haberse informado, pero los controladores (IRST es un software RAID manejado por el sistema operativo y los controladores; no en hardware).

Sin embargo, nunca usé IRST, ya que es el peor de los dos mundos, sin ventajas de rendimiento o puertos adicionales obtenidos de HW RAID, ni la flexibilidad total del software RAID. Así que no tengo idea de cómo se quejarán las ventanas ruidosas si la matriz genera errores.

Ya que hizo que el controlador se salga de la configuración normal de AHCI, también tendrá que ajustar para leer los parámetros SMART de HDD. Lo cual también es parte del paquete del controlador y del paquete de software con el que lamento (o no tan tristemente) no estoy familiarizado.

Independientemente, la mejor apuesta es una unidad de disco defectuosa desde el primer día, y como se ejecutó en un espejo, la matriz se cubrió con éxito para esto. A costa de retrasos adicionales.

Ahora de algunos supuestos y antecedentes a sus preguntas reales:

¿Por qué el controlador no pudo diagnosticar un disco era defectuoso?

Lamentablemente no lo sé. Supongo que iRST instalaría un elemento del panel de control o un programa de estado. A menos que lo hayas ocultado o desactivado, algún mensaje debería haber estado disponible.

¿Y cómo puedo asegurarme de que realmente me avise si un disco está fallando?   ¿Si lo configuro de nuevo para el modo RAID?

Ahora este es mucho más fácil. Configure el controlador SATA en el modo AHCI normal. Instale el sistema operativo en el SSD. Luego agregue ambos discos duros y use el software de Windows RAID, que no es lo mismo que el primero, para combinar ambas unidades en un espejo.

La ventaja de esto es que es más portátil (léase: más fácil de recuperar si ocurre una falla) y deja a los controladores SATA en su modo normal. Cualquier herramienta SMART debe poder comunicarse con el disco.

Hennes
fuente
Intel RST instaló una aplicación de administración, pero siempre decía que todo estaba bien; esto es exactamente de lo que me quejaba: sospechaba que un disco estaba defectuoso, pero el software RAID no lo diagnosticó por completo. Solo descubrí lo que realmente estaba sucediendo cuando rompí el RAID y Windows finalmente pudo acceder directamente a los discos.
Massimo
Y sí, abandoné RST, configuré el controlador para el modo AHCI y cambié al software de Windows RAID; Después de reemplazar el disco defectuoso, por supuesto. Todo ha funcionado bien desde entonces.
Massimo
Bah. Sabía que esta era una publicación antigua y que mi falta de conocimiento en primer lugar es un obstáculo. Esperaba señalar parte del razonamiento y cómo hacerlo mejor. Parece que ya has llegado a esa parte. Sin embargo, no sentí la tentación de instalarlo por primera vez en mi plataforma de prueba para descubrir cómo diagnosticar esa parte de manera inmediata. :(
Hennes
-1

En Windows, puede usar smartmontools, que durante años puede ver atributos inteligentes y ejecutar pruebas en unidades individuales, incluso si son miembros de Intel Fake-Raid.
El instalador más fácil está en http://www.netpower.fr/smartmontools-win que le permite configurar avisos por correo electrónico, ventanas emergentes, etc.

vanilla
fuente
Un gui-wrapper gratuito para smartctl es gsmartcontrol, que se ejecuta en Windows aquí: gsmartcontrol.sourceforge.net/home/index.php/Downloads (En prefs, dígale a gsmartcontrol que use smartctl-nc.exe más reciente de smartmoxntools). A people.chem.duke.edu/~staff/smart/… es una captura de pantalla! [gsmartcontrol-intel-fake-raid.png] ( people.chem.duke.edu/~staff/smart/… ) donde se pueden ver los arreglos de Intel raid y Discos individuales disponibles para prueba y monitoreo como / dev / cdsmiN, M
vanilla