Wir zeigen euch im ersten Teil der Reihe, welche inhaltlichen und technologischen Herausforderungen aufgrund gemischter IT-Systemlandschaften und dezentraler IT-Infrastrukturen entstehen können und wie Datenvirtualisierung helfen kann.
"Jedes Unternehmen muss sich im Laufe seines Lebenszyklus der Herausforderung stellen, Daten aus unterschiedlichen Systemen zu kombinieren."
Die Notwendigkeit, Daten aus unterschiedlichen Systemen zu kombinieren und zu nutzen, ist eine Herausforderung, der sich jedes größere Unternehmen im Laufe seines Lebenszyklus stellen muss.
Diese Herausforderung kann durch verschiedene Faktoren ausgelöst werden, etwa durch die Verwendung verschiedener Systeme innerhalb der unterschiedlichen Unternehmensbereiche wie Produktion, Einkauf oder HR, durch organisatorische Gegebenheiten wie Auslandsgesellschaften oder Akquisitionen, oder durch die Notwendigkeit, externe Datenquellen zu integrieren.
Inhaltliche Herausforderungen beim kombinierten Reporting
Die Aufrechterhaltung der inhaltlichen Konsistenz der Daten kann durch unterschiedliche Aspekte erschwert werden. Häufige Ursache hierfür sind inhomogene Nummernkreise für Kunden, Produkte oder Materialien in den unterschiedlichen Unternehmenssystemen.
Aber auch fehlende Wechselkurse, unterschiedliche Datenformate bei Datums- und Zahlenwerten erschweren die Aufrechterhaltung einer konsistenten Auswertung. Da Daten häufig nur in Kombination mit entsprechender Geschäftslogik ihren informativen Zweck erfüllen, gilt auch hier die Herausforderung, diese bei dezentraler Nutzung übergreifend konsistent zu halten.
Technologische Herausforderungen
Viele Hersteller von Datenbanken, Warehouse Systemen oder anderen Unternehmenssystemen verwenden ihre eigenen proprietären Technologien, Schnittstellen und Tools. Diese sind meist schwer miteinander kombinierbar und stellen Endanwender bei übergreifenden Analysen vor große Herausforderungen. Selbst offene Schnittstellenarchitekturen wie „Application Programming Interface“ (API) oder „Representational State Transfer“ (REST) können vom Endanwender sehr häufig nicht ohne Programmierkenntnisse genutzt werden.
"Ein automatisierter Bezug und die dynamische Integration der Daten in Analysen sind oftmals nicht möglich."
Ein weiteres Problem sind Netzwerkgrenzen, die dann vorhanden sind, wenn verschiedene Unternehmensbereiche eigene dezentrale IT-Infrastrukturen betreiben oder Daten von Drittfirmen (Zulieferer, Kunden, Datenlieferanten, etc.) bezogen werden müssen.
Auch beim Bezug von Daten eines einzelnen Systems können technische Einschränkungen, Komplexität in der Benutzung oder fehlender Zugang zu erforderlichen Anwendungen die Ursache dafür sein, dass ein automatisierter Bezug und die dynamische Integration der Daten in Analysen nicht möglich sind.
Herkömmliche Lösungsansätze und ihre Probleme
In der Regel entscheiden sich Unternehmen, die mit diesen Herausforderungen konfrontiert werden, für die Einführung eines Data Warehouse Systems oder eines Data Lakes. In diesen Systemen werden die Daten der unterschiedlichen Quellen über meist aufwändige, mehrstufige Transformations-, Harmonisierungs- und Bereinigungsprozesse von den ursprünglichen Quellen in eine oder mehrere neue Datenpersistenzen kopiert. Es entstehen redundante Kopien der Daten.
Die Einführungsprojekte dieser Lösungen sind oftmals sehr zeitaufwändig und kostenintensiv. Nachträgliche Änderungen an den oft sehr komplexen Ladeprozessen sind meist mit signifikantem Aufwand verbunden und werden nach Möglichkeit vermieden. Doch die Geschäftswelt verändert sich auch nach der Einführung eines Warehouse Systems weiter, etwa durch die Einführung weiterer oder die Ablösung bestehender Systeme, durch Unternehmenszusammenschlüsse, geänderte Marktsituationen oder durch neue fachliche und legale Anforderungen.
Die Langzeitfolgen
Angesichts des Aufwands für Änderungen an bestehenden Warehouse Systemen erfolgt üblicherweise eine strenge Priorisierung der Anpassungsanforderungen. Anforderer müssen häufig ihr eigenes Budget und viel Geduld mitbringen, bis Änderungen im regulären Release-Prozess umgesetzt und nutzbar gemacht werden können.
"Die Workarounds bestehen häufig aus sich wiederholenden, zeitintensiven und fehleranfälligen manuellen Prozessen."
Werden Änderungswünsche abgelehnt, sind betroffene Mitarbeiter oder Abteilungen auf sich allein gestellt und müssen sich mit mühsamen Workarounds behelfen. Diese bestehen häufig aus sich wiederholenden, zeitintensiven und fehleranfälligen manuellen Prozessen. In einigen Fällen greifen die Betroffenen auch zu alternativen Datenbank- oder datenbankähnlichen Lösungen. Dies kann schnell zu Wildwuchs und unkontrollierten Schatten-Systemlandschaften führen, die weder alle technischen noch regulatorischen Anforderungen erfüllen.
Zusätzlich kommen hierbei in der Regel kostengünstige und weniger leistungsstarke Systeme zum Einsatz oder die Ausführung erfolgt direkt auf dem eigenen PC, was das ursprüngliche IT-Investment in teure und leistungsstarke IT-Systeme gefährdet.
Überwindung inhaltlicher und technologischer Herausforderungen durch Datenvirtualisierung
Die Idee der Datenvirtualisierung basiert auf dem Gedanken, dass Daten nicht für jeden Anwendungsfall dupliziert und damit redundant gespeichert (persistiert) werden, sondern dass lediglich ein virtueller Verweis erstellt und gespeichert wird, der auf die Originaldaten im Quellsystem zeigt. Neben vielen weiteren Vorteilen, bietet diese Technologie Unternehmen zahlreiche Möglichkeiten, um inhaltliche Konsistenz zu erreichen und technologische Hürden zu überwinden.
"Der Zugriff auf die Daten kann vom Endanwender konfiguriert und einfach in seinen Analysen und Reports integriert werden ."
Indem der Zugriff auf die Daten nicht technisch implementiert (programmiert) werden muss, sondern vom Endanwender konfiguriert und einfach in seinen Analysen und Reports integriert werden kann, sind die Hürden für eine automatisierte Umsetzung deutlich geringer als bei klassischen Data Warehouse Systemen.
Notwendige Mappings, um im kombinierten Reporting mögliche abweichende Nummernkreise zu harmonisieren, zusätzliche Währungsumrechnungen oder die Harmonisierungen von Datums- und Zahlenwerten können vom Endanwender selbst angelegt und verknüpft werden.
Die Vorteile von Datenvirtualisierung
Da die Daten immer im Moment des Zugriffs direkt aus dem Quellsystem geladen werden, braucht sich der Anwender nicht um die Überwachung von Ladestrecken und auch nicht um die Aktualität der Daten zu sorgen. Alle definierten Transformationsschritte werden in Echtzeit auf die Daten des Quellsystems oder der Quellsysteme angewendet.
Auch die Berechtigungskonzepte werden dank Single Sign-On Technologien weiterhin vom Quellsystem definiert und können vom Anwender einfach wiederverwendet werden.
Diese Vorgehensweise erlaubt es dabei nicht nur, den Zugriff auf Systeme unterschiedlicher Hersteller und Technologien herzustellen, sondern auch über Netzwerkgrenzen hinweg den sicheren Zugriff auf die Daten zu ermöglichen.
Comments