Problemas de almacenamiento: Prolongación de la vida de un heredado ML370 de Compaq

8

Tengo un ML370 original, de antes incluso había generaciones (2000). El sistema de almacenamiento se compone de un controlador Smart Array 431, 2 9.1 Gb Ultra3 SCSI (COMPAQ BD009635C3) y 4 146.8 Gb Ultra3 SCSI (COMPAQ BD14687B52).

Los dos 9 conciertos forman la matriz A que forma un RAID 1 + 0 lógico, que es la unidad del sistema operativo. Los cuatro conciertos de 146.8 forman la matriz B que se divide en aproximadamente 12 lógicas RAID 5. Lamentablemente, algunas de esas lógicas se montan mediante "uniones" sobre directorios del sistema; "inetpub", "Archivos de programa", "Base de datos" (SQL Server) y "Almacén de mensajes" (Exchange) ... imagine que esto es Linux y que tendría mucho sentido, aunque en Windows es cuestionable.

Además, por lo que vale, el adaptador de red es un Linksys EG1032.

En este punto, todo (casi) se ha migrado fuera de este servidor, sin embargo, todavía hay una aplicación heredada que no se puede migrar debido a la arquitectura del bus y el soporte del controlador para los sistemas operativos actuales, ni está en línea para ser reemplazada en esta vez. Por lo tanto, es necesario mantener esta caja funcionando un poco más.

Ingrese problemas de almacenamiento; una de las unidades de 9 y 146 gig falla, por lo que todo el sistema de almacenamiento se degrada y debe abordarse lo antes posible. Entonces, la pregunta real es, ¿cuáles son mis opciones? ... y, por cierto, la intención es no gastar ni un centavo más en esto.

Este servidor ejecuta Windows 2003. Me preocupa que no sea posible volver a instalar todo desde cero, ya que ha pasado tanto tiempo. Tengo una SAN iSCSI a mi disposición y habría suficiente espacio en las tres unidades restantes de 146 conciertos para ejecutar dos como un espejo y mantener la tercera como repuesto. El desafío parece ser cómo reorganizar el almacenamiento existente mientras se mantiene el servidor en funcionamiento. El 431 no es muy inteligente.

Entonces, me pregunto, ¿se puede hacer que un servidor de esta edad haga un arranque de red? Sin embargo, mi primer intento fue ejecutarlo desde un disco lógico alternativo de algún tipo para poder separar los arreglos existentes y reconfigurarlos. Pero estoy abierto a sugerencias alternativas. Sé lo que puedo hacer con los servidores modernos, pero sé que algo de su antigüedad es mucho más limitado y no estoy seguro de las opciones.

TIA

tlum
fuente
1
15 años es ... una muy buena racha. Probablemente sea lo suficientemente viejo si las cosas comenzaran a fallar, cosas como el carnero y tal serían difíciles de reemplazar. También sospecharía considerar cuánto más eficientes son los sistemas modernos que un reemplazo moderno se pagaría solo en unos pocos años. También. 8gig discos. Mi teléfono tiene más capacidad de almacenamiento ...
Journeyman Geek
Fin de soporte de Windows Server 2003: 14 de julio de 2015.
Guillaume

Respuestas:

15

No quiero descartar el resto de su pregunta, pero el camino de menor resistencia es reemplazar los discos fallidos .

Cuando se trata de equipos heredados, puede haber una tentación de idear una solución esotérica o inteligente, pero su objetivo inmediato es mantener este hardware en particular en el estado actual y estable hasta que pueda migrar todo. Cambia lo menos posible.

Este es un Compaq Proliant ML370 original (blanco) . Creé e implementé un puñado de estos sistemas al principio de mi carrera, y definitivamente los apoyé hasta mediados de los años 2000 ...

Lo importante es saber que los servidores ProLiant originales (G1), G2, G3 y G4 utilizaron variantes de SCSI paralelo (Ultra-2, Ultra-3 née Ultra-160 y Ultra-320) con conectores SCA de 80 pines para los backplanes de la caja de la unidad. Esta tecnología fue suplantada por SAS y SATA.

A pesar de esto, los discos SCSI todavía están disponibles. El controlador Smart Array 431 RAID es lo suficientemente inteligente como para aceptar una unidad de reemplazo, por lo que no hay nada de qué preocuparse. Puede comprar los productos originales ( 9GB y 146GB ) en eBay con bastante facilidad por unos pocos dólares.

Haz eso.

Mientras tanto, tome las medidas necesarias para sacar su aplicación heredada del hardware de 15 años. Si esa configuración maneja el negocio, entonces es un riesgo operacional serio y los líderes empresariales deben estar preparados para lidiar con las consecuencias.

ewwhite
fuente
El problema es que hay un hardware muy costoso conectado a esta caja, lo que significa comprar un reemplazo moderno de $ 10k para retirar el ML370. Todas las aplicaciones de software se migraron hace años, lo que queda es un problema de compatibilidad de hardware. También me preocupa el hecho de que todas estas unidades tienen la misma edad ... dos menos, cuatro para ir quién sabe qué tan pronto. El requisito de almacenamiento restante es una fracción de lo que alguna vez fue, por lo que es ventajoso reducir el número de discos que están en línea, pero es mucho más fácil decirlo que hacerlo.
tlum
2
Solo compre algunas unidades de modelo similar usadas. Ya no se fabrican, pero puede recoger algunos discos (y extras) a un costo muy, muy bajo. Nunca podrás predecir cuándo o cómo fallarán los discos y dudo que los demás simplemente vayan a morir ahora. Nuevamente, ¿por qué agrega complejidad a la situación? No le conviene hacer cambios en esta configuración frágil hasta que tenga un camino viable para el reemplazo.
ewwhite
Escuché lo que estás diciendo, sin embargo, ha estado fallando y estoy tratando de adelantarme. No había mencionado que la fuente de alimentación acababa de morir y me las arreglé para instalar otra que tenía por ahí. La única unidad era mala, y antes de que pudiera consolidar el espacio en esa matriz, la de la matriz BOS falló. Cuando las cosas envejecen así, no se trata de si fallará, sino de qué tan pronto. Reducir el hardware al mínimo reduce la exposición al riesgo de falla. Por un lado, puedes seguir lanzándole hardware, pero eso ha sido una tarea y parece que no hay un final a la vista.
tlum
1
Intentar hacer otra cosa que no sea reemplazar el cabello con fuego será absolutamente un ejercicio arrojarle hardware. Entonces, Ed tiene razón. Repara el hardware fallido; mientras lo hace, siga gritándole a la empresa que este servidor completo necesita ser reemplazado antes de que ya no pueda solucionarlo.
mfinni
1
@tlum lo siento. Parece que desea adoptar un enfoque más complejo para resolver este problema del que realmente es necesario. Si desea arrancar en red la máquina, adelante ... Si cree que es seguro mover discos o intenta reconfigurar un controlador Smart Array 431, está arriesgando tiempo de inactividad, pérdida de datos y usuarios comerciales enojados. Los discos duros, los ventiladores y las fuentes de alimentación son consumibles, y las piezas están claramente disponibles por solo dólares. No mencionó la falla de la PSU anteriormente, pero debería hacer lo mínimo para mantener las cosas en funcionamiento ( mi sugerencia ) y / o un reemplazo de montacargas.
ewwhite
-1
  1. Algunas implementaciones de iSCSI le permitirán exportar unidades virtuales a SAS o SCSI (con el hardware apropiado). y dado que la caja 2003 tiene un conector SCSI externo, esto puede no ser difícil.

  2. el hardware arrancará en red sin demasiados problemas (es compatible con pxe), pero a menos que ya esté arrancando en red las cajas 2003 / XP configurando la infraestructura para hacerlo, es una pita.

  3. puede agregar una tarjeta pci esata y usarla con una incursión esata externa.

  4. puede usar una tarjeta sata raid o sas y usar unidades más nuevas.
hildred
fuente
Ahora tengo un repositorio CentOS local y Net boot / net install VM invitados, así que estoy equipado para arrancar pxe, pero Linux es lo único para lo que lo estoy usando en este momento. No estaba seguro de si podría hacer que el servidor con la NIC arrancara en red. Tengo que investigar eso un poco más si parece plausible.
tlum