Datenvirtualisierung als Turbo für die Cloud-Migration

bei

 / 23. April. 2020

Sorry, this entry is only available in German. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

Agilität, Flexibilität und Sicherheit sind die erfolgskritischen Faktoren einer modernen IT- und Datenarchitektur. Dabei führt nahezu kein Weg mehr an Cloud-Lösungen vorbei. Doch gerade die Migration von Unternehmensdaten und -Anwendungen in eine Cloud-Infrastruktur ist ein komplexes Unterfangen und stellt eine Hürde dar, vor der immer noch viele IT-Entscheider zurückschrecken. Thomas Niewel, Technical Sales Director von Denodo, erklärt, wie Organisationen mit Hilfe von Datenvirtualisierung die Migration von Daten in die Cloud meistern.

Kaum ein Unternehmen beschäftigt sich heute nicht mit den Vorteilen von Cloud Umgebungen. Viele Organisationen nutzen bereits IaaS, PaaS oder SaaS Lösungen oder planen die Migration in derartige Cloud Architekturen. Eine im März 2020 veröffentlichte Umfrage unter 250 Führungs- und IT-Fachkräften hat gezeigt, dass 53 Prozent der Unternehmen eine Hybride- oder Multi-Cloud Umgebung betreiben bzw. deren Einführung konkret planen. Somit entwickeln sich diese Formen der Cloud-Architektur zum de-facto Standard. Und stellen die Datenstrategie gleichzeitig vor die Herausforderung, wie ein integrierter und konsistenter Zugriff auf die heterogenen Quellen innerhalb dieser komplexen Landschaften hergestellt werden kann.

Vorteile und Stolperfallen beim Wechsel in die Cloud

Wie bereits eingangs erwähnt bieten Cloud Umgebungen viele Vorteile für Unternehmen:

  1. Wirtschaftlichkeit und Flexibilität: In vielen Fällen sind die Kosten für die Nutzung von Cloud Komponenten viel geringer als die Kosten für den Kauf und den Betrieb neuer Systeme. Neben den steuerlichen Vorteilen, die sich aus der Umwandlung von Investitionen in Betriebskosten ergeben, stellen Cloud-Service-Provider virtualisierte Ressourcen zur Verfügung, die dynamisch dem Leistungsbedarf angepasst werden können

 

  1. Geringerer Aufwand: Der Betrieb und die Wartung können – je nach gewähltem Modell – durch den Cloud Anbieter gewährleistet werden. Dadurch entfallen entsprechende Aufwände.

 

  1. Breites Leistungsspektrum: Cloud-Provider erweitern ihre Service-Palette über die Bereitstellung von Infrastruktur (IaaS) hinaus um Plattform (PaaS) Services wie beispielsweise Datenbankmanagement, Daten-Streaming, Datenintegration, Data Warehousing und Analytics sowie einer breiten Palette von SaaS Services.

 

Die Migration einer Anwendungslandschaft in eine Cloud Infrastruktur ist in vielen Fällen mit einfachen Mitteln möglich. Allerdings können oft nicht alle Komponenten einer Anwendungs- und System-Landschaft in eine Cloud Umgebung migriert werden. Der Grund hierfür ist häufig die Architektur der der Systeme. Ein Beispiel für derartige System Architekturen sind Mainframe basierte Anwendungs- Architekturen. Vielfach ist es sinnvoll, diese Systeme in eine moderne SaaS Anwendung zu überführen, bzw. diese Anwendungen auf Basis eines aktuellen Software Stacks neu zu entwickeln.

Durch diese Vorgehensweise ergeben sich zwangsläufig hybride Architekturen. Während einerseits Web-Server und Datenbanken auf eine einfache Art und Weise in eine Cloud Infrastruktur migriert werden können, müssen andere Komponenten vielfach weiterhin in einer on-premises Welt betrieben werden.  Ein weiterer Grund für das Entstehen hybrider Cloud Architekturen sind phasenweise Migrationen, um Risiken zu minimieren. So ist es teilweise notwendig, Komponenten eines on-premises Anwendungssystems schrittweise auf eine Cloud Plattform (z.B. SaaS) zu migrieren. Verglichen mit einer in einem Schritt durchgeführten Migration (Big Bang) würden durch diese Vorgehensweise Risiken minimiert.

Eine derartige hybride Infrastruktur, die wahlweise aus Cloud- und On-Premises-Anwendungen besteht, ist daher vielfach die Norm. Diese Architektur führt allerdings zu einer deutlich komplexeren Umgebung, was zur Folge hat, dass Unternehmensdaten in den unterschiedlichsten Formaten und an verschiedenen Lokationen gespeichert werden. Weitere Problembereiche sind eine übergreifende Security Strategie sowie die Datenkonsistenz.

Datenvirtualisierung verschafft Überblick

Datenvirtualisierung erlaubt die Einbindung verschiedenster Datenquellen, wie beispielsweise   Dateien, RDBMS Systeme, Hadoop- und, Cloud-Daten-Quellen sowie SaaS-Anwendungen. Unabhängig von Format und API können so Daten verschiedensten Ursprungs integriert werden und verbleiben trotzdem an ihrem ursprünglichen Ort. Der Zugriff auf die Virtualisierungsplattform erfolgt über klassische SQL-Schnittstellen (JDBC, ODBC) oder über den Aufruf von Web Services (REST, SOAP). So ist es möglich mit beliebigen Programmen und Tools auf Daten zuzugreifen. Dank der Datenvirtualisierung tritt die technische Komplexität und die Lokation der Datenspeicherung in den Hintergrund. User können sich auf die Funktionalitäten konzentrieren, die dem Unternehmen einen Nutzen bringen.

Die Integration verschiedener Datenquellen wird in der Datenvirtualisierungsplattform über Views realisiert. Unterschieden wird zwischen Base Views und Derived Views. Während Base Views für das Mapping zu externen Daten zuständig sind – etwa zu einer Tabelle in einer Oracle Datenbank, zu Daten in einer XML-Datei oder zu Daten aus einem Web Service – kann über Derived Views ein semantisches Datenmodell bereitgestellt werden. Dieses Datenmodell kann von verschiedenen Anwendungen und Tools genutzt werden. Derived Views erlauben beliebige Transformationen und Kombinationen von verschiedensten Datenquellen mit Hilfe von SQL-Operationen. Transformationen können beispielsweise Typ-Konvertierungen, Aggregationen, Filter, Joins, Unions und Berechnungen sein. Mithilfe dieser Views lassen sich Quelldaten in jede gewünschte Form umwandeln. Datenvirtualisierung verfügt außerdem über ausgefeilte Caching-Mechanismen.

Ein weiterer Vorteil der Datenvirtualisierung ist die Möglichkeit zur Implementierung von systemübergreifenden Security und Governance Regeln. Die Datenvirtualisierungsplattform verfügt über einen integrierten Security Layer, der es möglich macht, Security- bzw. Governance-Regeln auf alle integrierten Datenquellen anzuwenden.  Die Performance von Abfragen wird durch einen Cost Based Optimizer gewährleistet. Dieser Optimizer, der vergleichbar mit Optimizern in RDBMS Systemen ist, sorgt dafür, dass heterogene Abfragen über verschiedene Datenquellen auf Basis eines Regelwerks und Statistiken, optimiert werden.

Cloud-Migration beschleunigen – aber sicher!

Datenvirtualisierung entkoppelt Anwendungen von der physischen Datenhaltung. Durch diese Abstraktion entsteht eine hohe Flexibilität in hybriden Cloud Umgebungen. Durch die Datenvirtualisierung werden Anwendungen unabhängig vom Datenformat und dem Standort der Daten. Dadurch wird eine schrittweise Migration von Komponenten in Cloud Umgebungen ermöglicht.

Ein Beispiel: Eine on on-premises Anwendung, bestehend aus diversen Funktionalitäten/Modulen soll schrittweise in eine Cloud Umgebung migriert werden. Ein erster Schritt wäre die Implementierung eines Datenvirtualisierungs-Layers, um eine Entkopplung der Datenhaltung von der Anwendung zu ermöglichen. Dieser Layer dient nun als Schnittstelle zur Anwendung. Ein direkter Zugriff auf die Datenquellen wird von der Anwendung nicht mehr durchgeführt. Eine Migration von Datenquellen wird möglich, ohne Anpassungen an der Anwendung durchführen zu müssen. In weiteren Schritten können nun einzelne Funktionalitäten und Daten der Anwendung in eine Cloud Umgebung migriert werden. Durch dieses Vorgehen werden Risiken minimiert. Die Anwendung kann – nach Verlagerung der Datenquellen – weiterhin unverändert genutzt werden.

 

Thomas Niewel ist Technical Sales Director DACH bei Denodo, wo er Kunden bei der Architektur und Implementierung von Datenvirtualisierungsprojekten berät. Er verfügt über mehr als 20 Jahre Erfahrung als Berater in verschiedenen IT-Bereichen.