¿Puedo ejecutar de manera confiable con una sola tarjeta Fusion-io instalada en un servidor, o necesito implementar dos tarjetas en una configuración RAID de software?
Fusion-io no es muy claro (casi engañoso) sobre el tema al revisar sus materiales de marketing Dado el costo de las tarjetas, tengo curiosidad por cómo otros ingenieros las implementan en escenarios del mundo real.
Planeo usar la tarjeta de 1.2TB Fusion-io ioDrive2 de la marca HP para una solución de base de datos independiente patentada que se ejecuta en Linux. Esta es una configuración de servidor único sin una opción real de alta disponibilidad. Existe una replicación asincrónica con un RPO de 10 minutos que refleja los registros de transacciones a un segundo servidor físico.
Tradicionalmente, especificaría un servidor HP ProLiant de alta gama con los mejores pasos de CPU para esta aplicación. Necesito ir a SSD, y puedo adquirir Fusion-io a un precio más bajo que el SSD SAS empresarial para la capacidad requerida.
- ¿Necesito ejecutar dos tarjetas ioDrive2 y unirlas con el software RAID (md o ZFS), o es innecesario?
- ¿Debería preocuparme más por la falla de Fusion-io que por una falla en el controlador RAID o una falla en la placa base?
- Los administradores del sistema les gusta RAID. ¿Requiere esto una mentalidad diferente, dada la interfaz diferente y el nivel de desgaste en la tarjeta / corrección de errores disponibles en este factor de forma?
- ¿Cuál es la tasa de falla de estos dispositivos?
Editar: Acabo de leer un documento técnico de confiabilidad Fusion-io de Dell, y parece que "las tarjetas Fusion-io tienen muchas redundancias internas ... ¡No se preocupe por RAID!" .
Respuestas:
En última instancia, todo se reduce a su modelo de falla. ¿Cuál es el impacto de una falla?
Históricamente, siempre hemos RAID todo porque el costo de hacerlo ha sido insignificante. ¿Otros $ 500 por una unidad de espejo? Vale la pena el costo sin siquiera considerarlo.
Cuando se habla de otros $ 10K + para activar la duplicación, necesita un poco más de consideración.
No, no necesitas reflejar
Las tarjetas Fusion-io tienen bastante buena redundancia interna. Este no es el tipo de hardware donde su disco es un solo chip. En la mayoría de las situaciones en las que he observado fallas, ha sido un problema de firmware que ha afectado a ambos miembros de un espejo, por lo que RAID no habría importado.
Piense en una tarjeta Fusion-io como un controlador RAID con discos detrás. ¿Estás bien con una configuración de controlador único? Probablemente. Trátelo así.
En muchas configuraciones en las que implementaría unidades Fusion-io, tendrá otras protecciones integradas (redundancia a nivel de nodo), por lo que no tiene tanto sentido.
Sí, necesitas reflejar
RAID aumenta su disponibilidad . ¿Necesita disponibilidad máxima absoluta a pesar del costo? ¿Es costoso el costo de una falla y el posible tiempo de inactividad? Anímate y duplica las unidades. En una configuración estadísticamente grande, tendrá fallas en las unidades a pesar de las salvaguardas internas.
fuente
La redundancia en el dispositivo debería funcionar bien para fallas de los chips flash, de forma análoga a RAID entre todos los componentes que realizan almacenamiento de datos real.
Una falla de todo el dispositivo sería bastante análoga a la pérdida de un controlador RAID o placa base: estaría aproximadamente tan preocupado por la tarjeta Fusion-io como estos otros componentes de punto único de falla, aunque no lo hago ' No tenga experiencia con los dispositivos a gran escala para poder comparar las tasas de falla utilizando datos duros.
Agregar redundancia además de lo que el dispositivo ya tiene (por ejemplo, RAID de software entre múltiples tarjetas Fusion-io) sería muy similar a hacer RAID de software entre dos grupos de RAID de hardware en dos controladores RAID diferentes; podría valer la pena para los sistemas que garantizan una redundancia extrema para eliminar un solo punto adicional de falla, pero no para implementaciones comunes (¿un RPO de 10 minutos en un espejo debería ser lo suficientemente bueno para la mayoría de las aplicaciones?).
Sí, eso creo. Básicamente, está obteniendo un dispositivo que es como un controlador RAID y un montón de dispositivos de almacenamiento detrás de él en un solo paquete. Definitivamente es tentador preocuparse por poner sus datos confidenciales en un solo dispositivo, pero uno debe tener cierto nivel de confianza en la redundancia interna del dispositivo ... Lo que debería ser contrarrestado con una comprensión saludable de "RAID no es un concepto de " copia de seguridad ": siempre esté preparado para la falla de un componente redundante, o para que un usuario elimine los datos que contiene, con buenas copias de seguridad.
fuente
Como saben, hemos usado su kit por un tiempo, tanto en configuraciones RAID como no RAID, desearía tener alguna experiencia de falla para brindarles, pero no la tengo. No hemos tenido fallas con las que RAID hubiera ayudado y sus características de resistencia integradas solo están mejorando. Además, la función principal para la que los usamos ahora se escala / agrupa horizontalmente, por lo que tenemos aún menos razones para RAID. Grandes cartas, sin embargo, las recomiendo.
fuente
No estoy familiarizado con Fusion directamente, pero tengo algo de experiencia en SSD PCIe para trabajar.
Con los que trabajo presentan cuatro LUN diferentes para el sistema operativo, y trato la tarjeta PCIe como un HBA. Si quiero RAID, duplicaría dos LUN juntos usando el sistema operativo. Esto me permite una solución de una tarjeta para la redundancia. Sin embargo, si la tarjeta falla por completo, sigo en un arroyo. No sé si ioDrive hace lo mismo.
fuente
Compré 6 de las tarjetas de 1.2tb en los últimos dos meses. Uno de ellos ya ha fallado. Así que los atacaría absolutamente. Utilicé el espejo de disco activo de Windows. La unidad falló con el mensaje "falta el mapa LEB". Me dijeron que tendría que ser cambiado. Pero para obtener la aprobación de la RMA, tendría que tomar fotografías en ambos lados de la tarjeta fallida (lo que requiere un corte de producción para sacar la tarjeta). Y luego me dijeron que la tarjeta de reemplazo estaba agotada sin eta. Por lo tanto, es posible que desee pensar bastante antes de comprarlos.
fuente