RAID 10 o RAID 5 para varias máquinas virtuales: ¿cuál es la mejor opción?

8

Acabo de ordenar una nueva plataforma para mi negocio. Desarrollamos mucho software para Microsoft SharePoint y necesitamos el equipo para ejecutar varias máquinas virtuales con fines de desarrollo y prueba. Utilizaremos el VMware ESXi gratuito para la virtualización. Para empezar, planeamos construir e iniciar las siguientes máquinas virtuales, todo con Windows Server 2008 R2 x64:

  • Servidor de Active Directory
  • MS SQL Server 2008 R2
  • Servidor de compilación automatizado
  • SharePoint 2010 Server para alojar nuestro sitio web público y nuestra Intranet interna para algunas personas. La carga en este servidor será bastante insignificante.
  • Servidor de desarrollo 2xSharePoint 2007
  • Servidor de desarrollo 2xSharePoint 2010

Más allá de eso, tendremos que construir varias granjas de SharePoint con fines de prueba. Estas máquinas virtuales solo se iniciarán cuando sea necesario. Las especificaciones de la nueva plataforma son:

  • Servidor en rack Dell R610
  • 2xIntel XEON E5620
  • 48 GB de RAM
  • Unidades SAS 10k de 6x146GB
  • Controladora RAID Dell H700

Creemos que el nuevo servidor hará que nuestras máquinas virtuales funcionen mucho mejor que nuestra configuración existente (2xIntel XEON, 16GB RAM, 2x500 GB SATA en RAID 1). Pero no estamos seguros del nivel de RAID para la nueva plataforma.

¿Deberíamos optar por tener las unidades SAS de 6x146GB en una configuración RAID 10 o una configuración RAID 5? RAID 10 parece ofrecer un mejor rendimiento de escritura y un menor riesgo de falla de RAID. Pero tiene un costo de menos espacio en el disco. ¿Necesitamos RAID 10 o RAID 5 también sería una buena opción para nosotros?

Lars Fastrup
fuente
Utilizo RAID5 en casi todas partes, excepto los hosts VM (y algunos DB muy pesados). Son manera demasiado lento en las escrituras aleatorias. RAID1 o 10 es la única forma
Javier
¡Gracias a todos por la información! Me has convencido de ir a una configuración RAID10.
Lars Fastrup

Respuestas:

11

Hay muchas preguntas / argumentos similares en este sitio con respecto a R10 vs. R5 / R6, pero se reducen a "exposición durante la reconstrucción". El argumento para R10 sobre R5 es más fuerte cuando se trata de discos más grandes y más lentos que algunos compran porque su GB / $ £ € es mejor (es decir, SATA de 2 / 3TB 7.2k) ya que los arreglos de estos discos pueden tomar literalmente días para reconstruir después de un disco reemplazo o adición, lo que significa que toda la matriz se perdería si fallara un segundo disco durante esta ventana de reconstrucción.

Para muchos en este sitio, este riesgo es demasiado alto, incluido yo mismo. R6 cambia esto un poco, pero generalmente trae consigo un rendimiento de escritura mucho más lento. Además, hacer todo esto en el software reduce aún más el rendimiento durante la reconstrucción, ya que todos los datos pasan por el mismo bus, incluido el tráfico 'en vida'.

Ya ha hecho un buen trabajo al elegir sus componentes y seguramente verá una gran mejora en el rendimiento. Si yo fuera tú, no caería en el obstáculo final: usaría R10 sabiendo que has hecho lo correcto. Si le preocupa el espacio, puede usar discos Thin-Provisioned y / o comprar los discos de 600GB 10k en lugar de los discos de 146GB 15k, la disminución del rendimiento no será tan mala, pero tendrá mucho más espacio. ¿siempre podría comprar 4 x 600 hoy y agregar 2 más más tarde si necesitara los husillos adicionales?

Chopper3
fuente
1
Actualmente, esto no es verdad. Especialmente escribir operaciones pesadas son: malas con un Raid 5. Ejecuto Raid 10 para todos los servidores de alto rendimiento, e Hyper-V es uno de ellos. Especialmente, cuando llega el momento del parche, realmente puedes ver cómo van las cosas. Dicho esto, los discos SAS se desperdiciaron: los Velociraptors son casi tan buenos por un precio más bajo (para que uno pueda ponerlos en Raid 110).
TomTom
TomTom, ¿qué "en realidad no es verdad"? No lo aclaras, estoy recomendando R10 sobre R5 / R6, solo digo que R6 es el peor para el rendimiento de escritura. Y puede pensar que SAS se desperdicia, pero los velociraptors matarían algunos de mis sistemas, aunque tienen un buen valor.
Chopper3
2

Si se trata de un sistema de misión crítica, debe asegurarse de tener algunas unidades de repuesto a nivel local en caso de que falle (a menos que tenga algún contrato de soporte en el hardware que indique que puede obtener reemplazos el mismo día, pero incluso entonces un Vale la pena tener un repuesto local).

Ignorando eso (o suponiendo que las seis unidades no cuentan repuestos a los que podría tener acceso fácil) sugeriría RAID10 (tres RAID1 anidados en un RAID0) sobre RAID5 por las razones de rendimiento que usted menciona. O si el espacio no es en absoluto un problema y la redundancia y el tiempo de reconstrucción en caso de falla de la unidad es una gran preocupación, entonces incluso podría considerar dos RAID1 de tres unidades anidadas en RAID0 (pero eso es excesivo para la mayoría de los propósitos, aunque sería permitir que dos unidades en cada tramo R1 fallen al mismo tiempo mientras se mantiene viva la matriz).

Sin embargo, existe otra opción: tres matrices RAID1 separadas (o posiblemente dos matrices RAID10 si su controlador admite RAID10 de 3 unidades (RAID1E como lo llaman algunos controladores)). De esta forma, puede distribuir las máquinas virtuales en diferentes ejes para que compitan entre sí mucho menos por el ancho de banda de E / S. Dos máquinas virtuales en diferentes matrices RAID1 pueden intercambiar alegremente sus discos virtuales sin afectar mucho la capacidad de respuesta entre ellos o una VM en la tercera matriz. Por supuesto, esto puede terminar siendo un desperdicio de espacio: puede terminar con mucho espacio libre en una matriz, pero no desea usarlo ya que ya hay máquinas virtuales intensivas de E / S en uso constante en esa matriz, por ejemplo (aunque en este caso si tuviera una sola matriz, la VM que pondría en ese espacio estaría compitiendo por el acceso de E / S de esa manera de todos modos),

Esta técnica puede marcar una gran diferencia con las unidades basadas en disco giratorio y armado si equilibra sus máquinas virtuales entre las unidades correctamente. Todavía hace una diferencia en los SSD también, pero menos, ya que no tiene el movimiento de la cabeza y los problemas de esperar al sector correcto para pasar que causan latencia adicional que mata el rendimiento. Aunque, como dije anteriormente, puede ser más difícil de manejar. En el caso de uso que describa, puede colocar ese servidor sharepoint ligeramente cargado y el maestro de compilación en una matriz y las máquinas virtuales de desarrollo en otra (posible una matriz cada una, si tiene tres matrices y ninguna otra máquina virtual activa). A medida que cambien las necesidades, siempre puede mover las máquinas virtuales alrededor de las matrices para reequilibrar la carga con poco tiempo de inactividad (sin tiempo de inactividad si la solución de virtualización elegida admite migraciones en vivo entre almacenes de datos locales).

David Spillett
fuente
2

Como se respondió aquí varias veces, ¡simplemente no use RAID 5! ¡BAARF tiene algunos puntos de vista fuertes sobre el tema!

Obtendrá un rendimiento peor que RAID 10, rendimiento degradado durante una reconstrucción después de una falla de la unidad, y si otra unidad falla durante este período, ¡se restaurará de las copias de seguridad!

Jon Rhoades
fuente