Microsoft Fabric ist eine All-in-one Datenlösung, aber was heißt das? Das heißt, dass alles enthalten ist von der Datenbank bis zum Bericht. Dabei können verschiedene Quellen verknüpft und verwaltet werden. Fabric bietet verschiedene Tools zur Bereinigung und Weiterverarbeitung der Daten, zum Beispiel Notebooks und Pipelines. Die aufbereiteten Daten stellt man schlussendlich in einem Power BI Bericht dar. Zudem gibt es die Möglichkeit, eigene Machine Learning Algorithmen zu trainieren, alles in einer Anwendung.
Was macht Fabric besonders?
Unternehmen kämpfen mit komplexen Datenstrukturen und vielen kleinen Anwendungen. Das ist nicht nur teuer, sondern auch zeitraubend. Bei beidem hilft Fabric. Durch die einheitliche Plattform wird die Datenstruktur übersichtlicher und lässt sich von Administratoren leichter verwalten.
Bei immer größer werdenden Datenmengen verliert man schnell den Überblick. Welche Daten kommen woher? Wo werden sie von wem verwendet? Data Lineage ermöglicht es, diese Informationen für alle Arten von Daten zu visualisieren. Fabric synchronisiert Metadaten über gespeicherte Daten und Verarbeitungsprozesse. Somit ist es in der Lage, den Weg und die Nutzung von Daten in einer Art Datenflussdiagramm abzubilden.
Wer schon einmal Microsoft Purview verwendet hat, dem sollte dies bekannt vorkommen.
Wie ist Microsoft Fabric aufgebaut?
Wie schon gesagt ist Fabric eine Plattform für viele verschiedene Anwendungsfälle und deshalb gibt es auch eine Reihe von Applikationen, die eigene Aufgaben erfüllen.
OneLake
Die grundlegende Struktur ist der OneLake in welchem alle Daten zentral gespeichert und verwaltet werden können. Er ist selber keine eigene Applikation, ist jedoch die Grundlage für alle weiteren Funktionen. Alle Daten liegen an einem Ort und die Organisation erfolgt über Workspaces (Arbeitsbereiche). Das hört sich chaotischer an, als es in der Praxis ist, da die Navigation über die einzelnen Teilbereiche läuft.
Databases
Der neuste Zuwachs von Fabric, bietet jetzt auch eine klassische TSQL-Datenbank an. Die Datenbank entspricht der bekannten Azure SQL Datenbank und kann vollständig in Fabric genutzt werden. Die grundlegendste Form der Datenverwaltung hat damit ein neues Zuhause.
Data Warehouse
Dieser Teil bietet das klassische Data Warehouse an, wie es viele Unternehmen kennen. Daten können aufbereitet und strukturiert gespeichert werden. Des Weiteren hat man hier die Möglichkeit, externe Datenbanken in Fabric zu spiegeln, Dazu zählen bspw. Azure SQL-Datenbanken, Azure Cosmos DBs und Snowflake Datenbanken. In Zukunft soll es auch die Möglichkeit geben, On-Prem SQL Server in Fabric zu spiegeln.
Data Engineering
Auch wenn andere Bereiche von Fabric ebenfalls unter Data Engineering fallen, bildet dieser Bereich die modernsten Entwicklungen ab. Hier können Lakehouses erstellt und verwaltet werden. Diese Verwaltung erfolgt über Notebooks und Pipelines.
Data Factory
Wer schon einmal mit Azure Data Factory gearbeitet hat, der wird sich hier heimisch fühlen. Die Data Factory ist die Low Code Lösung für Data Engineering in Fabric. Dabei werden vor allem Dataflows und Pipelines erstellt. Durch über 150 Out-of-the-Box Konnektoren können verschiedene Datenquellen angebunden und ohne Code Kenntnisse verarbeitet werden.
Industry Solutions
Hier gibt es Vorlagen und Out-of-the-Box Lösungen für Industrie spezifische Probleme. So kann dieser Bereich z.B. für das verwaltungsaufwändige Thema ESG Reporting verwendet werden.
Real-Time Intelligence
Echtzeitdaten sind anders als andere Daten, es muss immer eine direkte Verbindung bestehen damit Daten in Echtzeit abgerufen werden können. Damit gehen einige Besonderheiten einher. Diese Besonderheiten werde mit Real-Time Intelligence abgefangen.
Data Science
Machine Learning ist schon längst im Alltag angekommen und in der Applikation Data Science kann es genutzt werden. Hier können Modelle trainiert und optimiert werden. Seit neustem gibt es auch AutoML, um wie in Azure ML Studio automatisierte Modelle zu trainieren.
Power BI
Den meisten ist Power BI ein Begriff, da es das bekannteste Programm für Reports ist. In Fabric würde es eingegliedert und bildet den Data Analytics Teil ab. Die vorher aufbereiten Daten kommen hier an und können in einem Bericht dargestellt werden.
Was unterscheidet Microsoft Fabric von anderen Produkten?
Der größte Vorteil von Fabric ist klar die Größe. Alle datenbezogenen Probleme können in einer Umgebung gelöst werden. Das heißt auch, nicht alles muss auf einmal gemacht werden. Wenn ein Unternehmen schon eine solide Datenbasis hat, dann kann auch bspw. nur Power BI genutzt werden. Und wenn man schon Power BI nutzt, kann man Stück für Stück alle Daten nachziehen, das schafft eine ordentliche und schnelle Lösung für die gesamte Datenlandschaft.
In einigen anderen Blogbeiträgen haben wir schon diverse Vergleiche gezogen, wenn dich Azure und Microsoft Fabric interessieren ist Fabric vs Synapse etwas für dich. Sonst interessiert dich Fabric vs Databricks vielleicht. Das Thema Fabric behandeln wir zudem auf unserem YouTube Kanal regelmäßig, wenn du tiefer einsteigen möchtest, ist das der ideale Weg.
Für diejenigen unter euch denen besonders die Kosten am Herzen liegen haben wir schon einen Blogbeitrag zur Kostenstruktur geschrieben.