SSD de consumidor (o prosumidor) frente a HDD rápido en un entorno de servidor

28

¿Cuáles son las ventajas y desventajas de las unidades SSD de consumo frente a las unidades giratorias rápidas de 10-15k en un entorno de servidor? No podemos usar SSD empresariales en nuestro caso ya que son prohibitivamente caros. Aquí hay algunas notas sobre nuestro caso de uso particular:

  • Hipervisor con 5-10 máquinas virtuales máx. Ninguna VM individual será una locura de E / S intensiva.
  • RAID 10 interno, sin SAN / NAS ...

Sé que los SSD empresariales:

  1. están clasificados para una vida útil más larga
  2. y rendir más consistentemente durante largos períodos

que los SSD de los consumidores ... pero ¿eso significa que los SSD de los consumidores son completamente inadecuados para un entorno de servidor, o seguirán funcionando mejor que las unidades de giro rápido?

Dado que estamos protegidos mediante RAID / copia de seguridad, estoy más preocupado por el rendimiento durante la vida útil (siempre y cuando no se espere que la vida útil sea muy baja).

David Budiac
fuente
1
Proporcione detalles sobre las marcas / modelos de hardware involucrados. Y sistemas operativos ... e hipervisores ... Tal vez incluso lo que harán las máquinas virtuales. ¡¡Más detalles!!
ewwhite
@ewwhite Servidores en rack de Dell. Probablemente un R430 o R730 con un controlador RAID PERC H730. También es probable que un servidor HyperV que aloje principalmente Windows Server Standard ... pueda usar VMware sobre HyperV. Aún considerando Inicialmente, las máquinas virtuales serán: controlador de dominio, DNS, WSUS, servicios de implementación. También puede agregar un servidor web interno.
David Budiac
1
¿Y cuánta capacidad necesitas?
ewwhite
@ewwhite 2TB utilizables como mínimo
David Budiac
superuser.com/questions/834521/… merece una lectura. Se trata de unidades de consumo de 10K , pero muchos de los puntos siguen siendo relevantes aquí.
Journeyman Geek

Respuestas:

22

Nota: Esta respuesta es específica para los componentes del servidor descritos en el comentario del OP.

  • La compatibilidad va a dictar todo aquí.
  • Los controladores de matriz PERC de Dell son dispositivos LSI. Entonces, cualquier cosa que funcione en un controlador LSI debería estar bien.
  • Su capacidad para monitorear la salud de su matriz RAID es primordial. Como se trata de Dell, asegúrese de contar con los agentes, alarmas y monitoreo adecuados para informar sobre los errores de su controlador PERC.
  • No use RAID5. Ya no hacemos eso en el mundo de los administradores de sistemas .
  • Tenga a mano un repuesto frío.
  • No necesariamente tiene que ir a un disco de consumidor. Hay unidades SSD empresariales disponibles en todos los puntos de precio. Insto a las personas a comprar SSD SAS en lugar de SATA siempre que sea posible.
  • Además, probablemente pueda encontrar mejores precios en el equipo oficialmente compatible (nadie paga al por menor).
  • No escuche vudú sobre unidades SSD giratorias para intentar burlar al controlador RAID o sus algoritmos de nivelación de desgaste. El caso de uso que ha descrito no tendrá un impacto significativo en la vida útil de los discos.

Ver también: ¿Son las unidades SSD tan confiables como las unidades mecánicas (2013)?

ewwhite
fuente
2
Escuché esto casualmente antes ... no usar RAID5 nunca más. ¿Principalmente por la fiabilidad? ¿Y qué usas en su lugar RAID6? RAID10?
David Budiac
1
+1 Buena respuesta. Realmente no consideraría comprar SSD de grado de consumo para usar en una PERC H700 / H710 / H730. Solo Google para "unidades PERC H730 no certificadas" mucha gente ha intentado eso antes y terminó con problemas. Por lo menos, compre SSD de nivel de entrada baratos como el ya mencionado Intel S3500.
s1lv3r
1
Buena respuesta, pero sería bueno si agregara algún razonamiento detrás de sus sugerencias (por ejemplo, ese enlace que publicó en los comentarios). Por qué es importante la compatibilidad es obvio, pero ¿por qué estás favoreciendo SAS sobre SATA?
Sebb
1
@Sebb ya escribió sobre eso.
ewwhite
8

Sí, las SSD serán mucho más rápidas que las unidades SAS. Para un rendimiento secuencial, un buen RAID de unidades SAS podría funcionar bastante bien, pero para el acceso aleatorio, los SSD los eliminarán del agua, lo que puede provocar una diferencia de rendimiento muy notable.

Dependiendo de las unidades SAS particulares y las unidades SSD particulares, las SSD pueden tener una mejor tasa de error de lectura irrecuperable hasta en un factor de 10.

Algunos consejos para si utiliza unidades SSD de consumo:

  • Conozca su carga de trabajo de escritura para poder estimar con qué frecuencia tendrá que reemplazar las unidades, ya que tienen una cierta resistencia de escritura
  • Si puede ahorrar espacio, aprovisione en exceso las unidades para que se parezcan más a las empresariales.
  • Consulte los artículos que comparan el rendimiento y escriba las características de resistencia de los SSD en la misma clase y elija el que mejor se adapte a sus necesidades
  • Personalmente, obtendría SSD con una garantía de 5 años porque creo que el fabricante proporcionará una mejor calidad como resultado. Sé que esta no es una regla difícil y rápida, solo una creencia personal.
  • Hay unidades SSD de consumo de gama baja y una de gama alta, a veces etiquetadas como "Pro", es posible que desee buscar las de esa clase
  • Esto también se aplica a las unidades empresariales, pero asegúrese de estar monitoreando el MWI (indicador de desgaste de medios) para saber cuándo reemplazar las unidades
sa289
fuente
El exceso de aprovisionamiento es un buen consejo para las grandes cargas de trabajo de escritura.
ewwhite
7

Los SSD de grado de consumidor funcionarán bien en muchos servidores para casos de uso.

Son mucho más rápidos que los discos SAS. Sugeriría que la razón para obtener discos empresariales sobre discos de consumo no es la velocidad, son los ciclos de lectura y escritura y una mejor ingeniería, por ejemplo, los supercaps están presentes en algunos SSD empresariales donde la versión de grado de consumidor no tiene esto, si pierde Al alimentar el servidor, es menos probable que sus datos sean eliminados.

Debe tener en cuenta que RAID no es una copia de seguridad; si va a RAID un par de SSD, está bien, pero obtiene diferentes marcas de SSD, o al menos diferentes modelos, por lo que tienen diferentes características de rendimiento. Cuando los SSD mueren, es mucho más probable que lo hagan sin previo aviso, y NO HAY CAPACIDAD DE RETIRAR LOS DATOS: por otro lado, son 10 veces más confiables que los discos duros normales.

Mire los discos de la serie 850 de Samsung, al menos para la mitad de la matriz, son / fueron prosumidores y ofrecen una buena inversión por su dinero, y se promociona como más confiables que 2d nand. (Usan 3d nand).

Además, como alguien más mencionó, no haga RAID5. Las unidades tienen mucho para que funcione de manera confiable, y respalde sus datos.

davidgo
fuente
Solo para agregar, el 850 pro es el indicado. el estándar 850 usa TLC
Journeyman Geek
@JourneymanGeek: creo que el 850 EVO y el 850 Pro usan 3D nand, es la serie 840 la que no. Esto está respaldado por el sitio de Samsung: samsung.com/global/business/semiconductor/minisite/SSD/global/… . Estoy mucho menos seguro, pero creo que el 850 pro tiene supercaps y mejor ingeniería, pero la memoria es Muy similar si no idéntico.
davidgo
@davidgo Por eso compras Intel;). A menos que las cosas hayan cambiado, los SSD Intel dejarán de aceptar escrituras cuando fallen y seguirán siendo legibles para que los datos puedan copiarse. techreport.com/review/26523/…
DetlevCM
3
@DetlevCM: siguen siendo legibles hasta el primer reinicio en el que intencionalmente se bloquean . Eso en sí mismo los descalifica automáticamente para cualquier uso serio.
MSalters
@MSalters No se supone que ... (se supone que debe seguir siendo legible, solo que no se puede escribir)
DetlevCM
6

Si los está utilizando para escrituras, para evitar la corrupción de datos en caso de falla de energía, debe asegurarse de considerar solo los modelos con un supercap. P.ej. Intel S3500, Samsung 845DC Pro

De lo contrario, los SSD de consumo son más adecuados para el almacenamiento en caché.

JamesRyan
fuente
Voté esto aunque no estoy de acuerdo. Ciertamente, los supercaps, etc. son una buena idea para un SSD, de ahí el voto positivo, pero implica que los SSD de los consumidores no son confiables, no creo que sea correcto, de hecho, afirmo que son 10 veces más confiables que los discos duros giratorios. Además, los discos duros no tienen supercaps o equivalentes, y de hecho son más vulnerables a los cortes de energía. La cuestión es que los sistemas de archivos modernos tienen diarios para mitigar el riesgo de pérdida (y hay ciertas aceleraciones que no debe usar en una unidad a menos que tenga una copia de seguridad de supercap / batería)
davidgo
3
@davidgo porque los HD no mienten sobre el almacenamiento en caché de escrituras de sincronización, mientras que muchos SSD de consumidores sí lo hacen
JamesRyan
Esto, esto, 1000 veces esto. Los SSD de Comsumer mentirán al controlador RAID , haciendo posible la pérdida de datos incluso en diseños RAID altamente redundantes. Si usa SSD en la empresa, quiere el condensador incorporado.
Joel Coel
6

Incluso los SSD de grado de consumidor son mucho más rápidos que los HDD de 15k más rápidos, por lo que desde el punto de vista del rendimiento estarán bien ( si usa el disco correcto y si los sobreaprovisiona), pero tuvo que elegirlos cuidadosamente , especialmente debido a cómo interactúan con controlador RAID basado en hardware ...

  1. Primero, verifique si la unidad asequible de nivel empresarial de nivel básico (como Intel S3500 / S3600, Micron M500DC y Micron M510DC) está a su alcance. Si es así, puede omitir toda la lotería para el consumidor.
  2. Compruebe si sus tarjetas RAID admiten discos de terceros. Por ejemplo, el firmware anterior de DELL para las tarjetas H700 / H710 / H710p se negó a inicializar discos sin el nombre de DELL. Una actualización posterior inicializó dichos discos, pero marcó la matriz "degradada". Solo las actualizaciones de firmware relativamente recientes (finales de 2013) corrigieron esa situación precaria.
  3. Mantenga habilitada la caché privada de su disco. Algunas tarjetas RAID obligarán a desactivar el caché privado del disco. Esto mata el rendimiento para SSD de nivel de consumidor, ya que hacen un uso intensivo de la memoria caché DRAM privada tanto para almacenar en caché su tabla de indirección como para enmascarar la latencia intensa involucrada en borrar / programar MLC NAND. Por ejemplo, una unidad Crucial M550 240GB de otra manera muy rápida escribe a una velocidad increíblemente lenta de 5 MB / S cuando su caché interna está desactivada.
  4. Si es posible, prefiera los discos con protección FULL power-loss. Esto se coloca directamente en el campeón de la empresa, pero, como se indicó anteriormente, hay discos relativamente baratos en este campeón.
  5. Si no hay una SSD protegida con pérdida de energía completa en su lista de compras, al menos use un disco con pérdida de energía parcial para la protección de datos en reposo. Algunos controladores excelentes con tal protección son el Crucial / Micron M500 / M550 y el nuevo M600. Micron incluso tiene un documento interesante sobre cómo / por qué sobreaprovisionar su M600unidad para su uso en entornos de virtualización. De todos modos, recuerde que con unidades protegidas de pérdida de energía no completa, sigue siendo una pequeña posibilidad de perder / corromper sus datos. ¿Cuán pequeño? depende del comportamiento de su controlador RAID (por ejemplo, si emite un comando de descarga ATA final después de transferir datos a un disco habilitado para caché) y del firmware del disco, por lo que no es posible darle una respuesta detallada. Lo que puedo decir es que en todas mis pruebas, las tarjetas RAID PERC parecen siempre vaciar el caché privado del disco (si está habilitado)
  6. Aprovisione en exceso sus unidades de consumo , al menos con una capacidad reservada del 25/30%.
  7. No utilice unidades de consumo de segunda clase. Incluso los buenos controladores de consumo tienen sus problemas, y elegir un disco de consumo de nivel inferior es un problema.
shodanshok
fuente
5

La inconsistencia de rendimiento de los SSD de los consumidores puede causar problemas con algunos controladores de incursión, los picos en la latencia de E / S se exacerban cuando se usa un controlador de incursión, ya que a menudo no usará TRIM (no conozco ningún controlador que lo haga). Las unidades empresariales están diseñadas en torno a un rendimiento constante incluso sin TRIM, por lo que generalmente funcionan bien con los controladores RAID.

Si no necesita la alta resistencia, hay SSD empresariales de gama baja diseñados alrededor de ciclos de alta lectura y baja escritura. Intel S3500 o Samsung 845DC ofrecen SSD baratos pero compatibles con el controlador RAID.

Sin embargo, si está utilizando controladores RAID dell / hp, debe tener cuidado con la compatibilidad, en mi experiencia, HP es lo peor cuando se trata de unidades que no son HP con sus controladores y, a veces, no presentará ninguna información de monitoreo sobre las unidades.

user300497
fuente
5

La razón para ir con equipo de grado empresarial es la confiabilidad más que la velocidad. La mayoría de los SSD de consumo son MLC, y el material del extremo inferior es TLC (MLC hace 2 bits por celda, TLC hace 3, y son menos efectivos y confiables que SLC). En algún momento, también pueden soltar el caché de memoria RAM a bordo para ahorrar costos, ya que las celdas nand se vuelven más baratas. Un SSD empresarial también tiene una mayor redundancia incorporada con más chips de repuesto y nand

El TLC más nuevo, más lento, teóricamente menos confiable, tiene un MBTF más bajo. Te gustaría ir por unidades MLC

En cuanto a la fiabilidad, es una bolsa mixta. Tienes resistencia a los golpes físicos en la cabeza, claro, pero los controladores pueden morir. La resistencia al manejo ha mejorado significativamente .

Considere algunas cosas: todas unidades mueren. Si es importante, es absolutamente necesario respaldarlo. Considere esto como un almacenamiento cercano a la línea y tenga en cuenta la falta de fiabilidad.

Si está buscando resistencia, un SSD de consumo moderno y de alta gama (como el Samsung 850 Pro) tiene una resistencia bastante decente. Los 850 profesionales tienen una capacidad de 150-300 tb de escrituras (en comparación con 73 tb para el modelo anterior y 7300 a 14600 tb para los modelos más nuevos). Puede intercambiar espacio por resistencia y energía jugando con espacio libre. Los SSD empresariales vienen con más espacio libre, por lo que si una celda o chip SSD se desgasta, puede ajustarse.

Muchas unidades de consumo no le permiten leer cuando falla la resistencia de escritura. Una gran marca lo hace, pero no recuerdo cuál.

Editar: Recientemente, se informó un 'error de kernel de Linux' con SSD de Samsung en general, los discos duros de grado empresarial son aburridos, tecnología confiable y antigua. Discos duros de consumo, supongo que un poco menos. Algunos de los errores están siendo eliminados, y hay cambios en curso, como nvme cada vez más común. Esté preparado para probar sus SSD antes de cometer algo crítico. Este parece ser un caso único, ¡pero podrías ser tú!

Journeyman Geek
fuente
-1

Si es importante, RAID 1. Prefiero tener dos SSD de consumidor barato en RAID 1 que el mejor SSD empresarial. El par debe usar aproximadamente a la misma velocidad, pero aparte del desgaste, es extremadamente improbable que fallen al mismo tiempo. Debe tener suficiente RAM para limitar drásticamente la paginación, de modo que pueda colocar su sistema y programas en un disco duro y luego colocar sus bases de datos en el par SSD. Dado que los discos duros son baratos, también puede permitirse RAID 1. Fuera de un incendio, esa configuración protegerá sus datos y proporcionará un excelente rendimiento. Luego, puede hacer una copia de seguridad en la nube y llamarlo por día.

rarchimedes
fuente
55
Los SSD empresariales tienen un condensador incorporado para protegerse contra la pérdida repentina de energía. Los SSD de consumo no solo carecen de esto, sino que también les mentirán a los controladores RAID acerca de haber descargado correctamente los buffers volátiles, haciéndolos vulnerables a la pérdida de datos incluso en configuraciones RAID altamente redundantes.
Joel Coel