Das Semantische Modell in Microsoft Fabric kommt immer wieder zur Sprache, wenn du dich mit Microsoft Fabric beschäftigst. Aber was ist das überhaupt? Ich bringe ein wenig Licht in die „dunkle semantische“ Welt.
Stell dir vor, du hast riesige Mengen an Daten, die aus verschiedenen Quellen kommen – aus verschiedenen Abteilungen, Systemen oder externen Datenquellen. Diese Daten liegen oft in verschiedenen Formaten vor, in verschiedenen Tabellen und Datenbanken, und es ist nicht immer klar, wie sie miteinander zusammenhängen.
In einem ersten Schritt solltest du die Daten in ein Stern-Schema überführen und das am Besten mit Hilfe der Medaillon-Architektur.
Im Idealfall hast du dann deine Daten im Gold-Layer als Stern-Schema (oder als Snowflake) vorliegen. Genau an dieser Stelle setzt das semantische Modell an. Du kannst es dir wie ein intelligentes Schichtensystem vorstellen, das die Gold-Layer-Daten nimmt und sie in eine klare, strukturierte Form bringt, die für jeden verständlich ist.
Wie funktioniert das?
Ich erkläre es dir anhand einiger Sichtweisen:
- Daten verstehen und strukturieren: Du hast vielleicht viele Daten, aber ohne Kontext weiß niemand, was sie wirklich bedeuten. In einem semantischen Modell definierst du Beziehungen zwischen den Daten. Zum Beispiel, wenn du Daten zu Kunden, Bestellungen und Produkten hast, sorgt das semantische Modell dafür, dass klar ist: Ein Kunde kann viele Bestellungen haben, und jede Bestellung kann mehrere Produkte enthalten. Das Modell macht also klar, wie sich die Daten zueinander verhalten. Hier sei nochmal erwähnt, dass du sie vorher am besten in ein Stern-Schema überführt hast.
- Komplexe Daten vereinfachen: Ohne ein semantisches Modell würdest du dich durch Dutzende von Tabellen kämpfen müssen, um zu verstehen, was zusammengehört. Mit dem semantischen Modell kannst du eine einheitliche Sicht auf die Daten bekommen. Es bündelt die Informationen, die du brauchst, und blendet das aus, was nicht relevant ist.
- Einheitliche Begriffe und Definitionen: Ein weiterer Vorteil ist, dass alle im Team die gleichen Begriffe und Definitionen verwenden. Es gibt keine Verwirrung mehr, weil jeder unterschiedliche Namen für dieselben Dinge verwendet. Du kannst zum Beispiel sagen, „Kunde“ bedeutet immer „ein individueller Käufer“.
- Mehr Menschen können mit den Daten arbeiten: Ein semantisches Modell macht die Daten zugänglicher – nicht nur für die IT-Experten oder Datenwissenschaftler, sondern für jeden im Unternehmen. Das bedeutet, auch nicht-technische Benutzer können mit den Daten arbeiten und wertvolle Erkenntnisse gewinnen, ohne tief in der Technik oder den Datenstrukturen drin zu sein. Die Komplexität wird also herausgenommen, und jeder sieht nur das Wesentliche.
- Verbesserte Berichterstattung und Analysen: Wenn du mit einem klar strukturierten Modell arbeitest, wird es viel einfacher, Berichte und Dashboards zu erstellen. Die Daten sind nicht nur durcheinander, sondern du kannst sie so aufbereiten, dass jeder schnell die wichtigen Kennzahlen (KPIs) versteht und analysieren kann, ohne die Daten mehrfach prüfen zu müssen.
Ein Beispiel in Fabric
In Microsoft Fabric habe ich einen Editor für das Semantische Modell. Einige werden die Sicht aus Power BI kennen. Ich habe hier ein Bild aus einem einfachen Modell eingefügt.
In dem Beispiel ist gut das Stern-Schema zu erkennen. Die Faktentabelle in der Mitte und die zugehörigen Dimensionen drumherum. Hier kann ich (identisch zu Power BI) Attribute oder ganze Tabellen ausblenden. Mit Hilfe von DAX können Kennzahlen definiert werden und für alle Benutzer zur Verfügung gestellt werden.
Am Ende ist wichtig zu verstehen, dass Anwender oder Berichtsentwickler nur diese Sicht zur Verfügung gestellt bekommen. Damit können sie dann arbeiten. So habe ich die Möglichkeit Frontend und Backend und damit auch verschiedene Teams zu trennen. Das semantische Modell hilft mir dabei, die Daten in eine klar verständliche Sprache zu übersetzen, sodass alle Beteiligten im Unternehmen die richtigen Entscheidungen treffen können.
Fazit – Semantisches Modell in Microsoft Fabric
Ein Semantisches Modell in Microsoft Fabric hilft dir, Daten zu organisieren, zu verbinden und so aufzubereiten, dass jeder im Team damit arbeiten kann – ohne sich in den Details zu verlieren. Es sorgt für klare Beziehungen zwischen den Daten, eine einheitliche Sprache und einfachere Analysen. So wird das Arbeiten mit Daten nicht nur einfacher, sondern auch schneller und weniger fehleranfällig.
Ich werde in einem kommenden Blogartikel auch auf die Fähigkeit von Direct Lake im semantischen Modell eingehen. In einem anderen Beitrag habe ich bereits erwähnt, dass das inzwischen auch in Power BI Desktop geht. Ich finde aber der Direct Lake-Modus ist das absolute Killer-Feature in Microsoft Fabric und sollte daher nochmal explizit beschrieben werden.