Ein Data Warehouse (DW oder DWH), auch bekannt als Enterprise Data Warehouse (EDW), ist ein System zur Berichterstattung und Datenanalyse und gilt als Kernbestandteil von Business Intelligence DWs sind zentrale Speicher für integrierte Daten aus einer oder mehreren unterschiedlichen Quellen. Sie speichern aktuelle und historische Daten an einem einzigen Ort, die zur Erstellung von Analyseberichten für Mitarbeiter im gesamten Unternehmen verwendet werden.

Die im Lager gespeicherten Daten werden aus den operativen Systemen (z.B. Marketing oder Vertrieb) hochgeladen. Die Daten können einen operativen Datenspeicher durchlaufen und erfordern möglicherweise eine Datenbereinigung[2] für zusätzliche Operationen, um die Datenqualität sicherzustellen, bevor sie im DW für das Reporting verwendet werden.

Das typische extrahieren, transformieren, laden (ETL) basierte Data Warehouse nutzt Staging, Datenintegration und Zugriffsschichten, um seine Schlüsselfunktionen unterzubringen. Die Staging-Schicht oder Staging-Datenbank speichert Rohdaten, die aus jedem der unterschiedlichen Quelldatensysteme extrahiert wurden. Die Integrationsschicht integriert die unterschiedlichen Datensätze, indem sie die Daten aus der Staging-Schicht transformiert, die diese transformierten Daten oft in einer ODS-Datenbank (Operational Data Store) speichert. Die integrierten Daten werden dann in eine weitere Datenbank verschoben, die oft als Data Warehouse Datenbank bezeichnet wird, wo die Daten in hierarchische Gruppen, oft als Dimensionen bezeichnet, und in Fakten und aggregierte Fakten eingeteilt werden. Die Kombination von Fakten und Dimensionen wird manchmal als Sternschema bezeichnet. Die Zugriffsebene hilft Benutzern beim Abrufen von Daten.

Die Hauptquelle der Daten wird bereinigt, transformiert, katalogisiert und steht Managern und anderen Geschäftsleuten für Data Mining, Online-Analytik, Marktforschung und Entscheidungsunterstützung zur Verfügung Die Mittel zum Abrufen und Analysieren von Daten, zum Extrahieren, Transformieren und Laden von Daten und zum Verwalten des Data Dictionary gelten jedoch auch als wesentliche Bestandteile eines Data Warehouse Systems. Viele Verweise auf Data Warehousing nutzen diesen breiteren Kontext. Eine erweiterte Definition für Data Warehousing umfasst daher Business Intelligence-Tools, Tools zum Extrahieren, Transformieren und Laden von Daten in das Repository sowie Tools zum Verwalten und Abrufen von Metadaten.

https://de.wikipedia.org/wiki/Data-Warehouse