¿Cuál es la diferencia entre Data Warehouse federado y descentralizado?

9

No puedo encontrar ninguna definición clara o explicación de ninguno de estos. Ambos parecen descentralizados. Parece que en DWH federado, los datos se distribuyen y no se integran en un único repositorio y se accede desde fuentes distribuidas.

Mientras que en la implementación de DWH descentralizada, los datos se integran en un repositorio central.

Por favor explique la diferencia entre estas dos implementaciones.

LifeH2O
fuente

Respuestas:

6

Un almacén de datos descentralizado es esencialmente una colección de almacenes de datos mantenidos por regiones individuales o unidades de negocio pero disponibles de forma centralizada. Estos pueden estar en el mismo servidor físico, compartir herramientas de informes o estar disponibles en toda la organización de alguna otra manera. También puede haber componentes centralizados, como la gestión de datos maestros. Esto normalmente se hace porque los almacenes de datos centralizados se vuelven difíciles de manejar más allá de cierto tamaño de organización. Un almacén de datos debe responder al cambio y, si no responde, los departamentos individuales comenzarán a construir sus propias soluciones.

Puede ver esto en los bancos de inversión, donde la tendencia es hacer depósitos de datos para cumplir requisitos específicos (por ejemplo, una iniciativa reguladora particular o algún tipo de información financiera) en lugar de construir un depósito centralizado en todo el negocio. Una empresa del tamaño de un banco grande es simplemente demasiado compleja para cumplir con los requisitos para un EDW totalmente centralizado en un período de tiempo razonable.

Un almacén de datos federado agrega una capa de consolidación maestra en los almacenes de datos descentralizados. Por lo general, esto solo albergará una porción vertical estrecha de los datos, ya que su propósito es consolidar métricas clave en todo el negocio para informes a nivel de empresa o grupo, en lugar de proporcionar una plataforma de MI generalizada para todos los departamentos. Los departamentos deben producir sus propios sistemas EDW o MI, pero deben proporcionar los conjuntos de datos necesarios para completar la capa de consolidación central.

Esta arquitectura te ofrece lo mejor de ambos mundos. La administración central puede ver sus métricas en toda la organización, y los departamentos pueden organizar soluciones de MI para satisfacer sus necesidades. La administración central solo necesita imponer los requisitos de datos que necesitan sus análisis y MI como fuentes proporcionadas por los sistemas departamentales. Si necesitan informes o análisis más detallados sobre un departamento específico, esto puede ser proporcionado por los sistemas departamentales.

El artículo vinculado a continuación analiza los almacenes de datos federados con más profundidad.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

Este artículo analiza las topologías del almacén de datos con más profundidad.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

Preocupado por TunbridgeWells
fuente
Entonces, ¿ambos están descentralizados, pero federados integran un subconjunto (métricas clave) en un solo lugar?
LifeH2O
Si. Eso es correcto. Tenga en cuenta que estas definiciones son bastante informales, por lo que la gente puede usarlas de manera diferente. Nunca tuve la oportunidad de construir ningún tipo de sistema, aunque una vez hice una propuesta para una arquitectura federada y vi un par de sitios que tenían sistemas que podrían caracterizarse como descentralizados por las definiciones que estoy usando.
Preocupado por