¿Qué diferencia al almacenamiento en la nube (Amazon AWS, Microsoft Azure, Google Apps) de las redes de almacenamiento del centro de datos tradicional (SAN y NAS)?

8

Alguna confusión debido a mi pregunta, para que sea simple:

"¿Qué tipo de almacenamiento utilizan los grandes proveedores de nube y por qué?"

Hasta donde yo entiendo, sin embargo, no puedo encontrar ningún tipo de diferencias de red de almacenamiento oficiales entre los centros de datos típicos y las nubes, todos los proveedores de la nube están utilizando DAS diferentes de los centros de datos típicos.

Incluso DAS tiene muchas desventajas que SAN o NAS, quiero aprender los detalles por qué las nubes usan DAS para fines de almacenamiento o aplicación.

Cualquier recurso o descripción será apreciada para aclararme.

EDITAR: Mientras leía el documento "Retos de redes y enfoques resultantes para la construcción de nubes a gran escala, David Bernstein y Erik Ludvigson (Cisco)" mencionan que,

Curiosamente, no vemos nubes de los principales proveedores que utilizan NAS o SAN. La arquitectura típica de la nube usa DAS, que no es típico de los enfoques de almacenamiento de Datacenter.

Pero aquí hay un conflicto: en mi opinión y también lo mencioné más adelante en el documento, Clouds debería usar SAN o NAS porque el DAS no es apropiado cuando una VM se mueve a otro servidor pero aún necesita acceder al almacenamiento desde el servidor original.

¿Cuáles son otras razones por las que las nubes de efectos prefieren DAS, NAS o SAN? ¿Qué tipo de almacenamiento utilizan los grandes proveedores de nube y por qué?

Berkay
fuente
2
¿Se pregunta "cuál es la diferencia para mí entre almacenar mis datos en la nube y almacenarlos con mi propia SAN o NAS" o "qué tipo de almacenamiento utilizan los proveedores de grandes nubes y por qué"?
Randy Orrison

Respuestas:

4

Esta respuesta ha sido editada después de que la pregunta fue aclarada.

¿Cuáles son otros motivos por los que las nubes prefieren DAS?

Donde "DAS" significa almacenamiento de conexión directa, es decir, unidades de disco duro SATA o SAS.

Todos los proveedores de la nube usan DAS porque ofrece mejoras de orden de magnitud en precio / rendimiento. Es un caso de escala horizontal .

En resumen, las unidades de disco duro SATA y los controladores SATA son productos baratos. Son productos de mercado masivo y tienen un precio muy bajo. Al construir un gran grupo de PC baratas con unidades SATA baratas, Google, Amazon y otros obtienen una gran capacidad a un precio muy bajo. Luego agregan su propia capa de software en la parte superior. Su software realiza la replicación multiservidor para obtener rendimiento y confiabilidad, monitoreo, reequilibrar la replicación después de una falla de hardware y otras cosas.

Puede echar un vistazo a MogileFS como un representante más simple del tipo de software que Google, Amazon y otros usan para el almacenamiento. Por supuesto, es una implementación diferente, pero comparte muchos de los mismos objetivos de diseño y soluciones que los sistemas a gran escala. Si lo desea, aquí hay un punto de partida para aprender más sobre GoogleFS .

más adelante en el documento, Clouds debería usar SAN o NAS porque DAS no es apropiado cuando una VM se mueve a otro servidor

Hay 2 razones por las cuales no se usan SAN.

1) precio. Los SAN son enormemente caros a gran escala. Si bien pueden ser la "mejor" solución técnica, normalmente no se utilizan en instalaciones a gran escala debido al costo.

2) El teorema CAP El teorema CAP de Eric Brewer muestra que a una escala muy grande no se puede mantener una consistencia fuerte mientras se mantiene una confiabilidad aceptable, tolerancia a fallas y rendimiento. Los SAN son un intento de hacer una fuerte consistencia en el hardware. Eso puede funcionar bien para una instalación de 5.000 servidores, pero nunca se ha demostrado que funcione para los más de 250.000 servidores de Google.

Resultado: hasta ahora, los proveedores de computación en la nube han optado por impulsar la complejidad de mantener el estado del servidor al desarrollador de la aplicación. Las ofertas actuales de la nube no proporcionan un estado coherente para cada máquina virtual. Los servidores de aplicaciones (máquinas virtuales) pueden fallar y sus datos locales se pueden perder en cualquier momento.

Cada proveedor tiene su propia implementación de almacenamiento persistente, que se supone que debe usar para datos importantes. Las ofertas de Amazon son buenos ejemplos; MySQL , SimpleDB y Simple Storage Service . Estas ofertas en sí reflejan el teorema de CAP: la instancia de MySQL tiene una fuerte consistencia, pero una escalabilidad limitada. SimpleDB y S3 se escalan fantásticamente, pero finalmente son consistentes.

Jesper M
fuente
Ahora la pregunta es clara. Gracias por los enlaces, los revisaré.
Berkay
Revisé todos los enlaces, gracias por las respuestas. En general, podemos decir que DAS es el preferido para los proveedores de la nube. Pero para algunas aplicaciones también se puede usar SAN o NAS.
Berkay
1

Si se utiliza DAS continuación, la disponibilidad es su problema

Si se utilizan DAS continuación, la disponibilidad es su problema. Y si son buenos, utilizarán varias capas de abstracción para garantizar que su problema no se convierta en su problema. En lugar de obsesionarse con la forma en que eligen montar sus discos dentro de su centro de datos, el problema es si la disponibilidad que garantizan en su SLA es adecuada para sus necesidades. Ah, y el verdadero elefante en la habitación, ¿qué haces si se van a la quiebra (probablemente no sea para algunos proveedores, pero aún así deberías considerarlo) y qué haces si usas estos datos localmente y tu conexión entre redes es no disponible: este último es mucho más probable que su elección de DAS que conduzca directamente a una interrupción.

Rob Moir
fuente
0

Aunque no tengo la respuesta en DAS vs SAN / NAS ... Hay muchas cosas a considerar al buscar soluciones de almacenamiento.

La cantidad de datos? Si estamos tomando sobre GB, está bien, un NAS con una copia de seguridad podría hacer el trabajo. Si hay datos de terrabytes, el precio sube muy rápido.

Creo que el precio es el factor principal ... si tiene una SAN, necesita:

  • Administradores para configurarlo / administrarlo.
  • Sala de servidores (electricidad, ancho de banda, medidas de seguridad alrededor de esa sala, ...)

Y aún así, no tienes redundancia en absoluto. Si tiene acceso a un centro de datos, las cosas pueden ser diferentes.

Otra cosa a considerar es la accesibilidad. ¿Estás archivando? Si la accesibilidad no es un problema, un par de veces por día / semana / mes archiva en su solución de almacenamiento.

Si, por otro lado, tiene datos a los que se debe acceder constantemente, encontrará rápidamente un cuello de botella de ancho de banda, limitación de hardware (como E / S). Pero, por otro lado, si tiene una gran cantidad de transferencia con sus datos, hay muchas posibilidades de que una solución de almacenamiento en línea le cueste mucho.

El ROI (Retorno de la inversión) es lo que anuncian todos los proveedores de soluciones de almacenamiento en línea y, a menudo, tienen razón, dependiendo del uso, por supuesto.

Buena suerte.

Embreau
fuente
0

(Solo opinión, y ampliamente generalizado).

La diferencia es la capa de abstracción que estás viendo (generalmente).

SAN / NAS generalmente le proporciona un volumen en el que puede instalar un sistema de archivos. El valor de este enfoque para el sistema final es que ha externalizado los detalles del hardware físico (por ejemplo, nivel RAID, ubicación física, etc.).

Por el contrario, el almacenamiento en la nube generalmente le proporciona una interfaz para un sistema de archivos. La ventaja aquí es que a menudo puede obtener funciones de orden superior de forma gratuita (por ejemplo, Dropbox realiza el versionado automático de cada archivo, de forma transparente).

cáliz
fuente