Tengo un servidor con 3 discos duros instalados y una capacidad total de 6. Estamos planeando maximizarlo, pero nuestro consultor también sugirió obtener un segundo controlador RAID "por redundancia" para admitir las nuevas unidades. Para mí, esto no tiene mucho sentido. Incluso con un segundo controlador RAID que ejecuta la mitad de los discos, todavía estamos atascados con solo la mitad de nuestros discos / programas / datos si uno de los controladores muere (que no es mucho mejor que ejecutar sin ninguno). Estamos poniendo vmware en el servidor y mencionó vagamente algunas características avanzadas de tolerancia a fallas / conmutación por error, pero si los discos son inaccesibles debido a un controlador fallido, ¿cómo se supone que funciona?
Contando solo las razones de redundancia, no de rendimiento, ¿por qué querría tener un segundo controlador RAID en mi servidor?
fuente
Respuestas:
En un diseño de 'alta disponibilidad de caja única', entonces sí, querría un segundo controlador, idealmente en un segundo bus también. Pero este tipo de enfoque ha dado paso a un diseño más económico basado en la agrupación donde la falla de una caja no detiene el servicio. Por lo tanto, depende de si planea usar un entorno en clúster o confiar en una sola caja. Incluso si su respuesta es la última, tener controladores duales puede verse como una complejidad adicional y tal vez exagerada.
editar: según su comentario sobre el uso de ESXi en su otra pregunta, tendría que decir que su agrupación es fabulosa , tenemos muchos clústeres de 32 vías que funcionan de manera brillante.
fuente
Un segundo controlador RAID que se usa activamente no es para redundancia. Solo si se trata de un controlador de espera en frío donde cambia todos sus discos cuando muere el primero. Entonces tienes redundancia (para el controlador). Pero tenga cuidado de hacerlo, como se publica aquí .
Por lo tanto, el RAID es para la redundancia de discos que conducen a un único punto de falla en el controlador. Tener un segundo controlador (no utilizado) puede resolver esto, ya que podría cambiar todo el disco al nuevo. Si esto funciona depende de otros factores ...
No soy hablante nativo, pero para mí la "tolerancia a fallos" es algo diferente a la "redundancia". ¿Puede alguien de habla inglesa ayudarme aquí?
fuente
En una sola caja, en realidad necesita dos controladores RAID, conectados a dos complejos raíz PCI-E diferentes, para tener redundancia completa del subsistema de E / S. Esto se puede lograr mediante dos configuraciones diferentes:
Un problema clave con ambos enfoques es que no tiene redundancia total del sistema: un problema de la placa base / CPU puede derribar todo el sistema, independientemente de la cantidad de controladores / discos que tenga.
Por esta razón, este tipo de redundancia en una caja rara vez se usa últimamente (aparte de eso en implementaciones de SAN de gama media / alta); más bien, la agrupación / duplicación de red está ganando una gran tracción. Con la agrupación en clúster (o la duplicación de red) tiene redundancia total del sistema, ya que un solo sistema fallido no puede negar el acceso a los datos. Obviamente, la agrupación tiene sus propias trampas, por lo que no es una bala de plata / fácil, pero en algunas situaciones sus ventajas no se pueden negar. Además, también puede utilizar la duplicación de red asíncrona para tener una redundancia de datos casi en tiempo real en ubicaciones geográficamente diferentes, de modo que un solo evento catastrófico no cause estragos en sus datos.
fuente
Necesitaría unidades SAS de doble puerto para proporcionar conmutación por error real en múltiples controladores. Si bien existen, es decididamente desmarcado, no en el rango de precios de un solo servidor que solo tiene almacenamiento interno.
Estas son tecnologías empleadas a menudo en sistemas SAN, donde la muerte del controlador es un problema real.
Para un solo servidor sin otras capacidades de conmutación por error, un segundo controlador no ganará nada: solo costará más dinero y proporcionará al consultor más ganancias.
fuente