<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Machine Learning - Bibliothek - arelium - Wir holen mehr aus deinen Daten</title>
	<atom:link href="https://arelium.de/category/machine-learning/feed/" rel="self" type="application/rss+xml" />
	<link>https://arelium.de/category/machine-learning/</link>
	<description></description>
	<lastBuildDate>Thu, 05 Mar 2026 09:10:48 +0000</lastBuildDate>
	<language>de</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://arelium.de/wp-content/uploads/2022/10/Logo_arelium_FavIcon-150x150.jpg</url>
	<title>Machine Learning - Bibliothek - arelium - Wir holen mehr aus deinen Daten</title>
	<link>https://arelium.de/category/machine-learning/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>k-Nearest Neighbors Algorithmus – Schnell und sicher Daten laden – Anleitung &#038; Tipps</title>
		<link>https://arelium.de/k-nearest-neighbors-algorithmus-schnell-und-sicher-daten-laden-anleitung-tipps/</link>
					<comments>https://arelium.de/k-nearest-neighbors-algorithmus-schnell-und-sicher-daten-laden-anleitung-tipps/#respond</comments>
		
		<dc:creator><![CDATA[Emil Vincazovic]]></dc:creator>
		<pubDate>Mon, 16 Feb 2026 10:00:58 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Data Engineering]]></category>
		<category><![CDATA[KI]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Azure Machine Learning]]></category>
		<category><![CDATA[Benchmarking]]></category>
		<category><![CDATA[k-Nearest Neighbors]]></category>
		<category><![CDATA[KI-Algorithmen]]></category>
		<category><![CDATA[Klassifikation]]></category>
		<category><![CDATA[Microsoft Azure]]></category>
		<category><![CDATA[Modellvergleich]]></category>
		<category><![CDATA[Regression]]></category>
		<guid isPermaLink="false">https://arelium.de/?p=21678</guid>

					<description><![CDATA[<p>k-Nearest Neighbors: ein Klassiker im Machine Learning mit aktueller Relevanz Der k-Nearest Neighbors Algorithmus, kurz kNN, geh&#246;rt zu den einfachsten und zugleich intuitivsten Verfahren im Machine Learning. Er ordnet neue Datenpunkte anhand der &#196;hnlichkeit zu bereits bekannten Beispielen ein. Dabei kann er sowohl f&#252;r Klassifikations- als auch f&#252;r Regressionsaufgaben eingesetzt werden. In modernen Data- und...</p>
<p>Der Beitrag <a href="https://arelium.de/k-nearest-neighbors-algorithmus-schnell-und-sicher-daten-laden-anleitung-tipps/">k-Nearest Neighbors Algorithmus – Schnell und sicher Daten laden – Anleitung &#038; Tipps</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="arelium-article">
<h2 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.8rem; margin-bottom: 1.2rem; color: #242323; font-style: normal;">k-Nearest Neighbors: ein Klassiker im Machine Learning mit aktueller Relevanz</h2>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Der k-Nearest Neighbors Algorithmus, kurz kNN, gehört zu den einfachsten und zugleich intuitivsten Verfahren im Machine Learning. Er ordnet neue Datenpunkte anhand der Ähnlichkeit zu bereits bekannten Beispielen ein. Dabei kann er sowohl für Klassifikations- als auch für Regressionsaufgaben eingesetzt werden. In modernen Data- und AI-Projekten bleibt kNN relevant, weil er ohne komplexe Modelltrainings auskommt, leicht verständlich ist und sich schnell als Benchmark oder Basismodell einbinden lässt. Gerade in explorativen Phasen, wie sie auch in <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning</a> oder in <a href="https://arelium.de/microsoft-fabric/">Fabric Notebooks</a> stattfinden, kann kNN wertvolle erste Erkenntnisse liefern.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Funktionsweise kompakt erklärt</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Das Prinzip von kNN ist so einfach wie wirkungsvoll. Stellen Sie sich vor, Sie betreten eine neue Stadt und wollen wissen, welche Restaurants Ihnen gefallen könnten. Sie fragen nicht jeden zufällig, sondern suchen nach den drei oder fünf Personen, deren Geschmack Ihrem am nächsten kommt. Die Empfehlungen dieser „nächsten Nachbarn“ bestimmen Ihre Entscheidung. Technisch betrachtet misst kNN die Distanz zwischen einem neuen Datenpunkt und allen bekannten Punkten im Datensatz. Die k Punkte mit der geringsten Distanz werden als „Nachbarn“ ausgewählt. Bei einer Klassifikation wird die Mehrheitsklasse dieser Nachbarn übernommen. Bei Regressionen wird der Mittelwert der Nachbarn berechnet.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Typische Einsatzbereiche</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">kNN ist besonders nützlich, wenn Daten klar strukturiert und überschaubar sind, etwa bei der Erkennung von Mustern in Kundenverhalten, der Empfehlung von Produkten oder der Klassifikation einfacher Sensorwerte im IoT-Umfeld. In der <a href="https://arelium.de/beginn-der-video-reihe-azure-ml-studio-am-beispiel-der-betrugserkennung/">Betrugserkennung</a> kann er als schnelles Vorfiltermodell dienen, bevor komplexere Verfahren wie neuronale Netze zum Einsatz kommen. Weniger geeignet ist kNN für sehr große Datensätze mit hohem Dimensionalitätsgrad, da die Berechnung der Distanz zu allen Punkten schnell sehr ressourcenintensiv wird.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Vorteile und Nachteile aus Praxissicht</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Der größte Vorteil liegt in der Einfachheit und Interpretierbarkeit. Fachbereiche können Ergebnisse ohne tiefes mathematisches Wissen nachvollziehen. Gleichzeitig ist kNN robust gegenüber Rauschen in den Daten, wenn k sinnvoll gewählt wird. Nachteile zeigen sich bei der Performance, sobald die Datenmenge stark wächst, sowie bei der Empfindlichkeit gegenüber der Wahl der Distanzmetrik und der Skalierung der Features.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Bezug zum Microsoft- und Azure-Ökosystem</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Im Microsoft-Umfeld lässt sich kNN einfach mit Bibliotheken wie <code style="background-color: #f8f9fa; padding: 2px 6px; border-radius: 3px; font-family: 1Consolas\', \'Monaco\', monospace; border: 1px solid #e9ecef; font-size: 0.9em;">scikit-learn</code> in <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning</a> oder <a href="https://arelium.de/azure-databricks/">Azure Databricks</a> einsetzen. Auch in <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric Notebooks</a> können Data Engineers den Algorithmus für schnelle Prototypen nutzen. Für produktive Szenarien bietet sich die Integration in <a href="https://learn.microsoft.com/en-us/azure/machine-learning/" target="_blank" rel="noopener">SynapseML</a> an, um kNN-Modelle skalierbar im Azure-Cluster zu betreiben. Über <a href="https://arelium.de/onelake-fuer-power-bi-desktop/">Onelake</a> können die zugrunde liegenden Daten zentral bereitgestellt werden, was die Wiederverwendung des Modells in verschiedenen BI-Reports erleichtert.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Mini-Beispiel in Python</h3>
<pre style="background-color: #f8f9fa; padding: 12px; border-radius: 6px; border: 1px solid #e9ecef; font-family: 'Consolas','Monaco',monospace; font-size: 0.9em; white-space: pre-wrap;">from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

# Daten laden
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    iris.data, iris.target, test_size=0.2, random_state=42
)

# kNN-Modell erstellen
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

# Vorhersage treffen
predictions = knn.predict(X_test)

# Genauigkeit prüfen
accuracy = knn.score(X_test, y_test)
print(f"Genauigkeit: {accuracy:.2f}")
</pre>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Dieses Beispiel lässt sich in einem Fabric Notebook oder direkt in Azure Machine Learning ausführen. Durch die geringe Komplexität ist kNN ideal für den Start, bevor auf komplexere Modelle umgestiegen wird.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Warum kNN heute noch relevant ist</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Trotz des Vormarschs von Deep Learning und <a href="https://arelium.de/machine-learning/">Foundation Models</a> behält kNN seinen Platz im Werkzeugkasten moderner Data Scientists. Er ist nicht nur ein Lern- und Demonstrationsmodell, sondern wird in produktiven Szenarien als schneller Klassifikator oder zur Vorverarbeitung eingesetzt. In hybriden Architekturen innerhalb von <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric</a> kann kNN als Edge-Algorithmus für schnelle Entscheidungen dienen, bevor Daten in zentrale KI-Modelle fließen. Er bleibt damit ein Beispiel dafür, wie bewährte Verfahren und moderne Plattformen gemeinsam Mehrwert schaffen.</p>
</div>
<p>Der Beitrag <a href="https://arelium.de/k-nearest-neighbors-algorithmus-schnell-und-sicher-daten-laden-anleitung-tipps/">k-Nearest Neighbors Algorithmus – Schnell und sicher Daten laden – Anleitung &#038; Tipps</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/k-nearest-neighbors-algorithmus-schnell-und-sicher-daten-laden-anleitung-tipps/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Gradient Boosting Azure Integration – Beispieldaten schnell und einfach erstellen</title>
		<link>https://arelium.de/gradient-boosting-azure-integration-beispieldaten-schnell-und-einfach-erstellen/</link>
					<comments>https://arelium.de/gradient-boosting-azure-integration-beispieldaten-schnell-und-einfach-erstellen/#respond</comments>
		
		<dc:creator><![CDATA[Emil Vincazovic]]></dc:creator>
		<pubDate>Mon, 02 Feb 2026 10:00:17 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Data Analytics]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Microsoft Fabric]]></category>
		<category><![CDATA[Azure Data & AI]]></category>
		<category><![CDATA[Datenanalyse]]></category>
		<category><![CDATA[Ensemble Learning]]></category>
		<category><![CDATA[Gradient Boosting]]></category>
		<category><![CDATA[KI-Beratung]]></category>
		<category><![CDATA[Modelloptimierung]]></category>
		<category><![CDATA[Predictive Analytics]]></category>
		<category><![CDATA[Python]]></category>
		<guid isPermaLink="false">https://arelium.de/?p=21692</guid>

					<description><![CDATA[<p>Gradient Boosting f&#252;r leistungsstarke Machine-Learning-Modelle im Microsoft- und <a class="glossaryLink"  aria-describedby="tt"  data-cmtooltip="&#60;div class=glossaryItemTitle&#62;Azure&#60;/div&#62;&#60;div class=glossaryItemBody&#62;&#38;lt;section class=&#38;quot;l-section wpb_row height_small&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;l-section-h i-cf&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;wpb_column vc_column_container&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;vc_column-inner&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;wpb_text_column&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;wpb_wrapper&#38;quot;&#38;gt;Was ist Azure?&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;div class=&#38;quot;w-separator size_medium&#38;quot;&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;div class=&#38;quot;w-image align_center&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;w-image-h&#38;quot;&#38;gt;&#38;lt;img width=&#38;quot;1300&#38;quot; height=&#38;quot;400&#38;quot; src=&#38;quot;https://arelium.de/wp-content/uploads/2024/01/Azure-2.png&#38;quot; class=&#38;quot;attachment-us_1300_400 size-us_1300_400&#38;quot; alt=&#38;quot;Azure&#38;quot; loading=&#38;quot;lazy&#38;quot; decoding=&#38;quot;async&#38;quot; srcset=&#38;quot;https://arelium.de/wp-content/uploads/2024/01/Azure-2.png 1300w, https://arelium.de/wp-content/uploads/2024/01/Azure-2-300x92.png 300w, https://arelium.de/wp-content/uploads/2024/01/Azure-2-1024x315.png 1024w&#38;quot; sizes=&#38;quot;auto, (max-width: 1300px) 100vw, 1300px&#38;quot; /&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;div class=&#38;quot;w-separator size_medium&#38;quot;&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;div class=&#38;quot;wpb_text_column&#38;quot;&#38;gt;&#38;lt;div class=&#38;quot;wpb_wrapper&#38;quot;&#38;gt;Microsoft Azure ist eine Cloudplattform, die von Microsoft entwickelt wurde und eine breite Palette von Diensten bereitstellt, die(...)&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/div&#38;gt;&#38;lt;/section&#38;gt;&#60;/div&#62;"  href="https://arelium.de/glossar/azure/"  target="_blank"  data-gt-translate-attributes='[{"attribute":"data-cmtooltip", "format":"html"}]'  tabindex='0' role='link'>Azure</a>-Umfeld Gradient Boosting ist ein Ensemble-Algorithmus im Bereich Machine Learning, der sich in den letzten Jahren zu einem der wichtigsten Werkzeuge f&#252;r die Erstellung hochperformanter Vorhersagemodelle entwickelt hat. Er kombiniert viele schwache Einzelmodelle zu einem starken Gesamtmodell und erreicht damit oft eine Genauigkeit, die klassische Verfahren &#252;bertrifft....</p>
<p>Der Beitrag <a href="https://arelium.de/gradient-boosting-azure-integration-beispieldaten-schnell-und-einfach-erstellen/">Gradient Boosting Azure Integration – Beispieldaten schnell und einfach erstellen</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="arelium-article">
<h2 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.8rem; margin-bottom: 1.2rem; color: #242323; font-style: normal;">Gradient Boosting für leistungsstarke Machine-Learning-Modelle im Microsoft- und Azure-Umfeld</h2>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Gradient Boosting ist ein Ensemble-Algorithmus im Bereich Machine Learning, der sich in den letzten Jahren zu einem der wichtigsten Werkzeuge für die Erstellung hochperformanter Vorhersagemodelle entwickelt hat. Er kombiniert viele schwache Einzelmodelle zu einem starken Gesamtmodell und erreicht damit oft eine Genauigkeit, die klassische Verfahren übertrifft. Eingesetzt wird er in Szenarien, in denen komplexe Muster in Daten erkannt und präzise Prognosen erstellt werden müssen, beispielsweise bei der Betrugserkennung, der Kundenabwanderungsanalyse oder der Preisvorhersage.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">In modernen Data- und AI-Projekten hat Gradient Boosting eine besondere Relevanz, da er auch mit heterogenen Datenstrukturen umgehen kann und sich sehr gut in skalierbare Cloud-Architekturen einfügt. Im Zusammenspiel mit <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric</a> und Diensten wie <a href="https://arelium.de/glossar/azure-machine-learning/">Azure Machine Learning</a> können Unternehmen diesen Algorithmus schnell und effizient produktiv einsetzen.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Wie Gradient Boosting arbeitet</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Das Grundprinzip von Gradient Boosting lässt sich mit einer Metapher erklären. Stellen dir vor du schreibst einen Bericht und verbesserst ihn in mehreren Durchgängen. Jeder Durchgang konzentriert sich darauf, die größten Fehler des vorherigen zu korrigieren. Genau so funktioniert Gradient Boosting: Es startet mit einem einfachen Modell, analysiert die Fehler, baut ein neues Modell, das genau diese Fehler reduziert, und wiederholt den Prozess viele Male.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Technisch gesehen basiert das Verfahren auf Entscheidungsbäumen mit geringer Tiefe, die nacheinander trainiert werden. Jedes neue Modell optimiert den sogenannten Gradienten der Verlustfunktion, also die Richtung, in der die größten Verbesserungen zu erwarten sind. So entsteht Schritt für Schritt ein starkes Modell aus vielen schwachen Komponenten.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Einsatzbereiche in der Praxis</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Gradient Boosting entfaltet seine Stärken besonders in Anwendungsfeldern, in denen hohe Vorhersagequalität entscheidend ist. Unternehmen setzen ihn für Kreditwürdigkeitsprüfungen, Betrugserkennung im Zahlungsverkehr, Absatzprognosen im Handel oder die Optimierung von Marketingkampagnen ein. In unserem <a href="https://arelium.de/beginn-der-video-reihe-azure-ml-studio-am-beispiel-der-betrugserkennung/">Azure Machine Learning Studio Beispiel zur Betrugserkennung</a> haben wir gezeigt, wie sich GBM-Modelle nahtlos in Data-Pipelines integrieren lassen.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Weniger geeignet ist Gradient Boosting in Echtzeitanwendungen mit extrem niedrigen Latenzanforderungen, wenn das Modell sehr groß ist oder die Trainingsdaten permanent in hoher Frequenz aktualisiert werden müssen. Hier können einfachere Modelle oder spezialisierte Online-Learning-Algorithmen besser passen.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Vorteile und Nachteile im Projektkontext</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Aus praktischer Sicht überzeugt Gradient Boosting durch seine hohe Genauigkeit, Robustheit gegenüber Ausreißern und Flexibilität bei unterschiedlich strukturierten Daten. Er lässt sich gut in Pipelines für komplexe Data-Engineering-Projekte einbinden und harmoniert mit Data-Lake-Architekturen wie <a href="https://arelium.de/onelake-fuer-power-bi-desktop/">OneLake in Microsoft Fabric</a>.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Die Nachteile liegen vor allem in der längeren Trainingszeit, insbesondere bei sehr großen Datensätzen, und einer geringeren Interpretierbarkeit im Vergleich zu einfacheren Modellen. Für Projekte mit strengen Anforderungen an die Transparenz des Modells muss diese Einschränkung berücksichtigt werden.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Implementierung im Azure-Ökosystem</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">In Azure lässt sich Gradient Boosting über mehrere Wege nutzen. Azure Machine Learning bietet native Unterstützung für Frameworks wie XGBoost, LightGBM oder CatBoost. Über <a href="https://arelium.de/microsoft-copilot-in-fabric/">Fabric Notebooks</a> können Data Scientists diese Bibliotheken direkt mit Daten aus dem Lakehouse verwenden. <a href="https://learn.microsoft.com/en-us/azure/machine-learning/concept-automated-ml" target="_blank" rel="noopener">SynapseML</a> erlaubt zudem die Integration in Big-Data-Workloads. Auch AutoML in Azure kann automatisch Gradient-Boosting-Modelle trainieren, wenn sie für das Problem geeignet sind.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Ein einfaches Beispiel in Python zeigt den typischen Ablauf:</p>
<pre style="background-color: #f8f9fa; padding: 12px; border-radius: 6px; border: 1px solid #e9ecef; font-family: 'Consolas','Monaco',monospace; font-size: 0.9em; white-space: pre-wrap;">from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import accuracy_score

# Beispieldaten erzeugen
X, y = make_classification(
    n_samples=1000,
    n_features=20,
    random_state=42
)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# Gradient Boosting Modell trainieren
gbm = GradientBoostingClassifier(
    n_estimators=100,
    learning_rate=0.1,
    max_depth=3
)
gbm.fit(X_train, y_train)

# Vorhersage und Bewertung
y_pred = gbm.predict(X_test)
print("Genauigkeit:", accuracy_score(y_test, y_pred))
</pre>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Dieses Beispiel lässt sich direkt in einer <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning Notebook-Umgebung</a> oder innerhalb von <a href="https://arelium.de/fabric-data-science/">Microsoft Fabric Data Science Workflows</a> ausführen.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Warum Gradient Boosting heute noch relevant ist</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Auch im Zeitalter von Deep Learning und großen Foundation Models bleibt Gradient Boosting ein wertvolles Werkzeug. Viele Business-Probleme erfordern keine riesigen neuronalen Netze, sondern profitieren von präzisen, ressourcenschonenden Modellen, die schnell trainiert und deployt werden können. Gradient Boosting ist dabei oft die erste Wahl, wenn tabellarische Daten mit hoher Vorhersagegenauigkeit verarbeitet werden müssen.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Gerade im Microsoft- und Azure-Umfeld, in dem Daten aus unterschiedlichsten Quellen wie <a href="https://arelium.de/glossar/azure-data-factory/">Azure Data Factory</a> oder <a href="https://arelium.de/azure-databricks/">Azure Databricks</a> zusammengeführt werden, bietet GBM einen klaren Vorteil. Es ist ein Algorithmus, der sowohl in Proof-of-Concept-Phasen als auch im produktiven Betrieb überzeugt und sich perfekt in moderne Data-Engineering-Architekturen integriert.</p>
</div>
<p>Der Beitrag <a href="https://arelium.de/gradient-boosting-azure-integration-beispieldaten-schnell-und-einfach-erstellen/">Gradient Boosting Azure Integration – Beispieldaten schnell und einfach erstellen</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/gradient-boosting-azure-integration-beispieldaten-schnell-und-einfach-erstellen/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Decision Trees Machine Learning – Beispieldaten importieren &#038; testen – Anleitung</title>
		<link>https://arelium.de/decision-trees-machine-learning-beispieldaten-importieren-testen-anleitung/</link>
					<comments>https://arelium.de/decision-trees-machine-learning-beispieldaten-importieren-testen-anleitung/#respond</comments>
		
		<dc:creator><![CDATA[Emil Vincazovic]]></dc:creator>
		<pubDate>Mon, 19 Jan 2026 10:00:16 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Data Analytics]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Microsoft Fabric]]></category>
		<category><![CDATA[Azure Machine Learning]]></category>
		<category><![CDATA[Datenanalyse]]></category>
		<category><![CDATA[Decision Trees]]></category>
		<category><![CDATA[Entscheidungsstrukturen]]></category>
		<category><![CDATA[KI-Algorithmen]]></category>
		<category><![CDATA[Klassifikation]]></category>
		<category><![CDATA[Modelltraining]]></category>
		<category><![CDATA[Regression]]></category>
		<guid isPermaLink="false">https://arelium.de/?p=21687</guid>

					<description><![CDATA[<p>Decision Trees: ein Klassiker im Machine Learning mit moderner Relevanz Decision Trees sind einer der bekanntesten und am h&#228;ufigsten eingesetzten Algorithmen im Bereich des &#252;berwachten Machine Learning. Sie bilden Entscheidungsstrukturen in Form von Baumdiagrammen ab und bieten eine intuitive M&#246;glichkeit, komplexe Klassifikations- oder Regressionsprobleme zu l&#246;sen. Die Grundidee besteht darin, Daten anhand bestimmter Merkmale schrittweise...</p>
<p>Der Beitrag <a href="https://arelium.de/decision-trees-machine-learning-beispieldaten-importieren-testen-anleitung/">Decision Trees Machine Learning – Beispieldaten importieren &#038; testen – Anleitung</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="arelium-article">
<h2 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.8rem; margin-bottom: 1.2rem; color: #242323; font-style: normal;">Decision Trees: ein Klassiker im Machine Learning mit moderner Relevanz</h2>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Decision Trees sind einer der bekanntesten und am häufigsten eingesetzten Algorithmen im Bereich des überwachten Machine Learning. Sie bilden Entscheidungsstrukturen in Form von Baumdiagrammen ab und bieten eine intuitive Möglichkeit, komplexe Klassifikations- oder Regressionsprobleme zu lösen. Die Grundidee besteht darin, Daten anhand bestimmter Merkmale schrittweise in Teilmengen zu unterteilen, bis eine klare Entscheidung oder Vorhersage möglich ist.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">In modernen Data- und AI-Projekten, insbesondere im Zusammenspiel mit Plattformen wie <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric</a> und <a href="https://arelium.de/glossar/azure-machine-learning/">Azure Machine Learning</a>, ist dieser Algorithmus relevant, weil er sowohl technisch effizient als auch fachlich gut erklärbar ist. Das erleichtert die Kommunikation zwischen Data Scientists, Entwicklern und Fachabteilungen und unterstützt die Umsetzung von transparenten KI-Lösungen.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Funktionsweise</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Ein Decision Tree arbeitet, indem er schrittweise Fragen zu den Eingabedaten stellt. Jede Frage teilt den Datenbestand in zwei oder mehr Gruppen. Die Auswahl der Frage basiert auf einem Kriterium wie der Informationsgewinnung oder der Reduktion der Entropie. Das Verfahren wiederholt sich rekursiv, bis die Daten in reine Klassen unterteilt oder ein Abbruchkriterium erreicht ist.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Eine einfache Metapher ist das Spiel „20 Fragen“. Man beginnt mit einer allgemeinen Frage, die viele Möglichkeiten ausschließt, und verfeinert die Fragen so lange, bis die gesuchte Antwort eindeutig ist. In der Praxis bedeutet dies, dass der Algorithmus aus Trainingsdaten Regeln extrahiert, die er später auf neue Daten anwenden kann.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Typische Einsatzbereiche</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Decision Trees sind stark in Szenarien, in denen Interpretierbarkeit entscheidend ist. Beispiele sind die Bewertung von Kreditrisiken im Finanzwesen, die Diagnoseunterstützung im Gesundheitsbereich oder die Betrugserkennung, wie sie auch im <a href="https://arelium.de/beginn-der-video-reihe-azure-ml-studio-am-beispiel-der-betrugserkennung/">Azure ML Studio Beispiel zur Fraud Detection</a> demonstriert wird.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Sie sind jedoch weniger geeignet für hochdimensionale, sehr komplexe Daten wie Bilder oder Audio, bei denen Deep-Learning-Modelle oft deutlich bessere Ergebnisse liefern.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Vorteile und Nachteile</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">In der Praxis punkten Decision Trees durch ihre einfache Visualisierbarkeit und die gute Interpretierbarkeit. Zusätzlich haben sie die Fähigkeit, sowohl numerische als auch kategoriale Daten zu verarbeiten. Sie sind robust gegenüber irrelevanten Features und benötigen oft weniger Datenvorverarbeitung. Nachteilig ist, dass einzelne Bäume zu Overfitting neigen können, wenn sie zu tief wachsen. Abhilfe schaffen hier Ensemble-Methoden wie Random Forests oder Gradient Boosted Trees, die ebenfalls im <a href="https://arelium.de/glossar/azure-machine-learning/">Azure Machine Learning</a> schnell implementierbar sind.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Integration ins Microsoft- und Azure-Ökosystem</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Im Azure-Umfeld lassen sich Decision Trees direkt in <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning</a> über AutoML oder eigene Python-Skripte einsetzen. In <a href="https://arelium.de/t-sql-notebook-in-microsoft-fabric/">Fabric Notebooks</a> können Modelle entwickelt, trainiert und über SynapseML skaliert werden. Damit ist es möglich, Daten aus <a href="https://arelium.de/onelake-fuer-power-bi-desktop/">Onelake</a> oder <a href="https://arelium.de/azure-data-lake/">Azure Data Lake</a> einzubinden und die Ergebnisse in <a href="https://arelium.de/power-bi/">Power BI</a> direkt zu visualisieren.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Mini-Beispiel in Python</h3>
<pre style="background-color: #f8f9fa; padding: 12px; border-radius: 6px; border: 1px solid #e9ecef; font-family: 'Consolas','Monaco',monospace; font-size: 0.9em; white-space: pre-wrap;">from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Beispieldaten laden
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    iris.data, iris.target, test_size=0.3, random_state=42
)

# Modell erstellen und trainieren
clf = DecisionTreeClassifier(
    max_depth=3,
    random_state=42
)
clf.fit(X_train, y_train)

# Vorhersage
y_pred = clf.predict(X_test)

# Genauigkeit ausgeben
print("Accuracy:", accuracy_score(y_test, y_pred))
</pre>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Dieses Beispiel nutzt den bekannten Iris-Datensatz und zeigt, wie einfach ein Decision Tree mit scikit-learn erstellt und getestet werden kann. In Azure Machine Learning könnte dieser Code direkt als Training Script verwendet werden, um das Modell in der Cloud zu trainieren und zu deployen.</p>
<h3 style="font-family: 1Lucida Sans Unicode\', \'Lucida Grande\', sans-serif; font-size: 1.4rem; margin-bottom: 1rem; color: #242323; font-style: normal;">Relevanz in der heutigen KI-Landschaft</h3>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Auch im Zeitalter von Deep Learning und Foundation Models behalten Decision Trees ihre Bedeutung. Sie sind oft der erste Schritt in einem Machine-Learning-Projekt, um ein Basisverständnis für die Daten zu gewinnen und schnelle, transparente Ergebnisse zu liefern. In Kombination mit Ensemble-Methoden wie XGBoost oder LightGBM erreichen sie auch in komplexen Szenarien hohe Genauigkeit.</p>
<p style="margin-bottom: 15px; text-align: justify; line-height: 1.7;">Wer im Microsoft-Ökosystem arbeitet, profitiert davon, dass Decision Trees sich nahtlos mit anderen Azure-Diensten, Data-Pipelines und Visualisierungstools verbinden lassen. Das macht sie zu einem wichtigen Werkzeug in modernen Projekten, die auf Transparenz, schnelle Iterationen und Integration in bestehende Business-Intelligence-Umgebungen setzen.</p>
</div>
<p>Der Beitrag <a href="https://arelium.de/decision-trees-machine-learning-beispieldaten-importieren-testen-anleitung/">Decision Trees Machine Learning – Beispieldaten importieren &#038; testen – Anleitung</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/decision-trees-machine-learning-beispieldaten-importieren-testen-anleitung/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Microsoft Fabric</title>
		<link>https://arelium.de/microsoft-fabric/</link>
		
		<dc:creator><![CDATA[Joel Galla]]></dc:creator>
		<pubDate>Thu, 12 Dec 2024 11:10:51 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Azure Synapse]]></category>
		<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Data Analytics]]></category>
		<category><![CDATA[Data Engineering]]></category>
		<category><![CDATA[Data Lake]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Microsoft Fabric]]></category>
		<category><![CDATA[Cloud]]></category>
		<category><![CDATA[OneLake]]></category>
		<category><![CDATA[Power BI]]></category>
		<guid isPermaLink="false">https://arelium.de/?page_id=14501</guid>

					<description><![CDATA[<p>&#160;</p>
<p>Der Beitrag <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><p>Microsoft Fabric ist eine All-in-one Datenlösung, aber was heißt das? Das heißt, dass alles enthalten ist von der Datenbank bis zum Bericht. Dabei können verschiedene Quellen verknüpft und verwaltet werden. <span data-teams="true">Fabric bietet verschiedene Tools zur Bereinigung und Weiterverarbeitung der Daten, zum Beispiel Notebooks und Pipelines. Die aufbereiteten Daten stellt man schlussendlich in einem Power BI Bericht dar. Zudem gibt es die Möglichkeit, eigene Machine Learning Algorithmen zu trainieren, alles in einer Anwendung.</span></p>
<h2>Was macht Fabric besonders?</h2>
<p>Unternehmen kämpfen mit komplexen Datenstrukturen und vielen kleinen Anwendungen. Das ist nicht nur teuer, sondern auch zeitraubend. Bei beidem hilft Fabric. Durch die einheitliche Plattform wird die Datenstruktur übersichtlicher und lässt sich von Administratoren leichter verwalten.</p>
<p>Bei immer größer werdenden Datenmengen verliert man schnell den Überblick. Welche Daten kommen woher? Wo werden sie von wem verwendet? Data Lineage ermöglicht es, diese Informationen für alle Arten von Daten zu visualisieren. Fabric synchronisiert Metadaten über gespeicherte Daten und Verarbeitungsprozesse. Somit ist es in der Lage, den Weg und die Nutzung von Daten in einer Art Datenflussdiagramm abzubilden.</p>
<p>Wer schon einmal Microsoft Purview verwendet hat, dem sollte dies bekannt vorkommen.</p>
<h2>Wie ist Microsoft Fabric aufgebaut?</h2>
<p>Wie schon gesagt ist Fabric eine Plattform für viele verschiedene Anwendungsfälle und deshalb gibt es auch eine Reihe von Applikationen, die eigene Aufgaben erfüllen.</p>
</div></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1024" height="403" src="https://arelium.de/wp-content/uploads/2024/01/Fabric-Aufbau-1024x403.png" class="attachment-large size-large" alt="Fabric Aufbau" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2024/01/Fabric-Aufbau-1024x403.png 1024w, https://arelium.de/wp-content/uploads/2024/01/Fabric-Aufbau-300x118.png 300w, https://arelium.de/wp-content/uploads/2024/01/Fabric-Aufbau-1015x400.png 1015w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></div></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>OneLake</h3>
<p>Die grundlegende Struktur ist der OneLake in welchem alle Daten zentral gespeichert und verwaltet werden können. Er ist selber keine eigene Applikation, ist jedoch die Grundlage für alle weiteren Funktionen. Alle Daten liegen an einem Ort und die Organisation erfolgt über Workspaces (Arbeitsbereiche). Das hört sich chaotischer an, als es in der Praxis ist, da die Navigation über die einzelnen Teilbereiche läuft.</p>
<h3>Databases</h3>
<p>Der neuste Zuwachs von Fabric, bietet jetzt auch eine klassische TSQL-Datenbank an. Die Datenbank entspricht der bekannten Azure SQL Datenbank und kann vollständig in Fabric genutzt werden. Die grundlegendste Form der Datenverwaltung hat damit ein neues Zuhause.</p>
<h3>Data Warehouse</h3>
<p>Dieser Teil bietet das klassische Data Warehouse an, wie es viele Unternehmen kennen. Daten können aufbereitet und strukturiert gespeichert werden.  Des Weiteren hat man hier die Möglichkeit, externe Datenbanken in Fabric zu spiegeln, Dazu zählen bspw. Azure SQL-Datenbanken, Azure Cosmos DBs und Snowflake Datenbanken. In Zukunft soll es auch die Möglichkeit geben, On-Prem SQL Server in Fabric zu spiegeln.</p>
<h3>Data Engineering</h3>
<p>Auch wenn andere Bereiche von Fabric ebenfalls unter Data Engineering fallen, bildet dieser Bereich die modernsten Entwicklungen ab. Hier können Lakehouses erstellt und verwaltet werden. Diese Verwaltung erfolgt über Notebooks und Pipelines.</p>
<h3>Data Factory</h3>
<p>Wer schon einmal mit Azure Data Factory gearbeitet hat, der wird sich hier heimisch fühlen. Die Data Factory ist die Low Code Lösung für Data Engineering in Fabric. Dabei werden vor allem Dataflows und Pipelines erstellt. Durch über 150 Out-of-the-Box Konnektoren können verschiedene Datenquellen angebunden und ohne Code Kenntnisse verarbeitet werden.</p>
<h3>Industry Solutions</h3>
<p>Hier gibt es Vorlagen und Out-of-the-Box Lösungen für Industrie spezifische Probleme. So kann dieser Bereich z.B. für das verwaltungsaufwändige Thema ESG Reporting verwendet werden.</p>
<h3>Real-Time Intelligence</h3>
<p>Echtzeitdaten sind anders als andere Daten, es muss immer eine direkte Verbindung bestehen damit Daten in Echtzeit abgerufen werden können. Damit gehen einige Besonderheiten einher. Diese Besonderheiten werde mit Real-Time Intelligence abgefangen.</p>
<h3>Data Science</h3>
<p>Machine Learning ist schon längst im Alltag angekommen und in der Applikation Data Science kann es genutzt werden. Hier können Modelle trainiert und optimiert werden. Seit neustem gibt es auch AutoML, um wie in Azure ML Studio automatisierte Modelle zu trainieren.</p>
<h3>Power BI</h3>
<p>Den meisten ist Power BI ein Begriff, da es das bekannteste Programm für Reports ist. In Fabric würde es eingegliedert und bildet den Data Analytics Teil ab. Die vorher aufbereiten Daten kommen hier an und können in einem Bericht dargestellt werden.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Was unterscheidet Microsoft Fabric von anderen Produkten?</h2>
<p>Der größte Vorteil von Fabric ist klar die Größe. Alle datenbezogenen Probleme können in <strong>einer </strong>Umgebung gelöst werden. Das heißt auch, nicht alles muss auf einmal gemacht werden.  Wenn ein Unternehmen schon eine solide Datenbasis hat, dann kann auch bspw. nur Power BI genutzt werden. Und wenn man schon Power BI nutzt, kann man Stück für Stück alle Daten nachziehen, das schafft eine ordentliche und schnelle Lösung für die gesamte Datenlandschaft.</p>
<p>In einigen anderen Blogbeiträgen haben wir schon diverse Vergleiche gezogen, wenn dich Azure und Microsoft Fabric interessieren ist <a href="/fabric-vs-synapse/">Fabric vs Synapse</a> etwas für dich. Sonst interessiert dich <a href="/fabric-vs-databricks/">Fabric vs Databricks</a> vielleicht. Das Thema Fabric behandeln wir zudem auf unserem <a href="https://www.youtube.com/@areliumgmbh">YouTube Kanal</a> regelmäßig, wenn du tiefer einsteigen möchtest, ist das der ideale Weg.</p>
<p>Für diejenigen unter euch denen besonders die Kosten am Herzen liegen haben wir schon einen<a href="/kosten-fuer-microsoft-fabric/"> Blogbeitrag zur Kostenstruktur</a> geschrieben.</p>
</div></div></div></div></div></div></section>
<p>&nbsp;</p>
<p>Der Beitrag <a href="https://arelium.de/microsoft-fabric/">Microsoft Fabric</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Fabric vs. Databricks</title>
		<link>https://arelium.de/fabric-vs-databricks/</link>
		
		<dc:creator><![CDATA[Joel Galla]]></dc:creator>
		<pubDate>Tue, 06 Aug 2024 11:04:53 +0000</pubDate>
				<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Cloud]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Microsoft Fabric]]></category>
		<category><![CDATA[Microsoft Power BI]]></category>
		<category><![CDATA[OneLake]]></category>
		<category><![CDATA[Power BI]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[SQl]]></category>
		<guid isPermaLink="false">https://arelium.de/?page_id=19839</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/fabric-vs-databricks/">Fabric vs. Databricks</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><p>Für viele Unternehmen, die ihre Datenverwaltung auf dem neusten Stand halten wollen, stellt sich wie immer die Frage: „Was für ein Tool soll ich benutzen?“. Die Einführung von Microsoft Fabric hat zu einem neuen Wettrennen geführt. Damit gilt es auch zu klären, welches Tool bei diesem Wettrennen gewinnt und für was sich Unternehmen entscheiden sollten.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Was ist Microsoft Fabric?</strong></h2>
<p>Im Jahr 2023 hat Microsoft seine neue All-in-One Lösung für die Datenverarbeitung veröffentlicht. Das Ziel von Fabric ist es, alle Datenverarbeitungen an einem Ort gesammelt anzubieten. Dabei vereint es viele Technologien, die Microsoft vorher schon angeboten hat. Dazu gehören z.B. Synapse Analytics, die Azure Data Factory und auch Power BI. Zur gesamten Verarbeitung gehört auch die Speicherung, welche im OneLake geschieht und im Verlauf des Beitrages noch wichtig wird.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Was ist Databricks?</strong></h2>
<p>Databricks ist als Unternehmen seit 2013 am Markt und auch als Gründer von Spark bekannt. Databricks hat sich vor allem auf Big Data spezialisiert und gehört im Gegensatz zu Fabric zu keinem einzelnen Cloud-Anbieter. Allerdings arbeitet Databricks mit vielen Cloud-Anbietern zusammen.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Fabric vs. Databricks – Wer steht für was?</strong></h2>
<p>Vor weg sollte gesagt sein, dass sich beide Tools in ihrer Zielsetzung unterscheiden. Databricks ist als Programm geplant, welches in verschiedenen Cloudplattformen genutzt wird und dabei besonders schnell große Daten verarbeiten kann. Dabei ist mit schnell vor allem die Datenauswertung gemeint und nicht notwendigerweise die Entwicklung.</p>
<p>Fabric auf der anderen Seite versucht alle Anwendungen besonders benutzerfreundlich an einem Ort bereitzustellen und ist als Anwendung von Microsoft sehr eng mit Azure verbunden. Damit folgt auch schon der erste Unterschied fürs Data Engineering. Databricks setzt vor allem auf Notebooks, die als solche immer über Code funktionieren wie z.B. Python, Spark und SQL. Auf der anderen Seite baut Fabric auch auf Low Code Möglichkeiten. Es können zwar, wie in Databricks auch, Notebooks verwendet werden. Es gibt aber auch die Möglichkeit über die Data Factory oder Data Flows Daten mit wenig Programmier-Erfahrung zu importieren. Eine kurze wichtige Anmerkung: die Notebooks in Databricks und Fabric basieren auf derselben Open-Source Technologie von Spark. Auch Fabric unterstützt Python, Spark und SQL.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3><span style="color: #b71234;"><strong>Wie werden die Daten gespeichert?</strong></span></h3>
<p>Wir haben auch zuvor schon ein Beispiel gesehen, wie beide Anwendungen dieselbe Technologie verwenden. Hier ist es grundlegend der Delta-Lake. Microsoft nennt seinen Delta Lake jedoch stattdessen &#8222;OneLake&#8220;.</p>
<p>Databricks setzt in seinem Delta Lake vollumfänglich auf Lakehouses und ermöglicht Data Warehouses nur innerhalb seiner Lakehouses. Falls Sie nochmal den Unterschied nachlesen wollen, können Sie das in unserem <a href="/lakehouse-vs-warehouse/">vorherigen Blogbeitrag</a> tun.</p>
<p>Microsoft Fabric kann beide Formen der Datenverwaltung. Dabei erlaubt es sowohl für SQL optimierte Data Warehouses als auch für Spark optimierte Lakehouses. Unterm Strich werden aber sowohl bei Databricks als auch bei Fabric alle Daten im Lake als Delta Parquet gespeichert.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3><span style="color: #b71234;"><strong>Wo hat Databricks die Nase vorne?</strong></span></h3>
<p>Databricks liegt bei der Computepower leicht vorne. Dadurch, dass sie die Entwickler von Spark sind und ihr Augenmerk auf Geschwindigkeit legen, können sie hier punkten. Gerade beim Real-Time Processing ist Databricks extrem schnell. Die hohe Geschwindigkeit macht sich natürlich besonders bemerkbar bei sehr großen Datenmengen wie bei Big Data. Außerdem sind diese hohen Geschwindigkeiten hilfreich bei besonders komplexen Analysen.</p>
<p>Wie durch den vorherigen Teil zu vermuten war ist Databricks damit beim Machine Learning vorne. Da wir über die Geschwindigkeit schon gesprochen haben, bleibt hier nur ein anderer Punkt. Databricks bietet auch Machine Learning Modelle von Drittanbietern an und differenziert sich damit klar von Fabric. In Fabric können keine Drittanbieter Modelle verwendet werden. Das Machine Learning in Fabric ist technisch sehr ähnlich zu Databricks, aber Databricks bleibt durch die Sparkgrundlage leicht vorne.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3><span style="color: #b71234;"><strong>Wo gewinnt Microsoft Fabric?</strong></span></h3>
<p>Die Benutzerfreundlichkeit ist bei Fabric höher. Nur Fabric bietet viele Low Code Möglichkeiten an, das heißt auch ohne Programmierkenntnisse kann man hier entwickeln. Natürlich ist es nicht unbedingt wichtig für Entwickler selber, da diese meistens gute Programmierkenntnisse haben, es bietet aber andere Vorteile. Gerade für kleine, schnelle Lösungen kann sowas von Vorteil sein. Ein anderer Vorteil ist klar die Wartung. Wenn ein Projekt größtenteils abgeschlossen ist, kann bei einer Low Code Umsetzung auch eine weniger erfahrene Person Fehler korrigieren und kleinere Probleme beheben.</p>
<p>Ein offensichtlicher Punkt ist, dass Fabric von Microsoft entwickelt wurde. Durch diesen Fakt ist Fabric natürlich voll in der Microsoft-Welt integriert, das heißt nicht, dass andere Anbieter nicht angebunden werden können.</p>
<p>Der größte Vorteil von Fabric ist die Datenvisualisierung. Der derzeitige Marktführer ist Power BI von Microsoft. Da Microsoft dies bewusst ist, haben sie Fabric um Power BI herum entwickelt und damit ist beides nativ verbunden. Power BI ist ein Teil von Fabric und wird mitgeliefert bei der Nutzung von Fabric. Databricks kann hier nichts Vergleichbares bieten.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Fabric vs. Databricks &#8211; Wer kostet wie viel?</strong></h2>
<p>Fabric und Databricks haben völlig unterschiedliche Preisstrukturen. <a href="https://www.databricks.com/product/pricing">Databricks</a> hat ein Pay-as-you-go Modell und die Preise richten sich nach der benutzen Leistung. Die Leistung wird dabei als DBU (Databricks Unit) verstanden und es wird je nach verbrauchter Leistung bezahlt. Die Preise richten sich zudem nach einzelnen Bereichen wie den Workflows, Databricks SQL Querys zwischen 0,22$ und 0,72$ pro DBU. (Stand 02.08.2024). Die Datenspeicherung liegt bei den einzelnen Cloudanbietern und kostet unterschiedlich viel.</p>
<p>Fabric funktioniert dabei anders. Der Preis in Fabric ist dreigeteilt. Zuerst muss eine sogenannte SKU bezahlt werden. Diese Kapazität legt die Leistung von Fabric fest. Wichtig hierbei ist, dass alle Bereiche von Fabric erworben werden, also alles von der Data Factory bis zu Power BI. Zu dieser Kapazität kommen noch Einzellizenzen pro Benutzer. Den letzten Anteil macht die Datenspeicherung aus, welche pro GB 0,024$ pro Monat im OneLake kostet. Ein kleiner Trick bei Fabric ist, dass die SKU abgeschaltet werden kann und dann keine Kosten anfallen, das heißt über Nacht können so z.B. Kosten gespart werden. Mehr Details finden Sie in unserem<a href="/kosten-fuer-microsoft-fabric/"> dazugehörigen Blogbeitrag</a>.</p>
<p>Zusammenfassend lässt sich zu Fabric vs. Databricks und den Kosten sagen, dass Databricks kurzzeitig wahrscheinlich leicht günstiger ist. Fabric schafft es allerdings mittelfristig und ganz sicher langfristig, die Kosten niedriger zu halten.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Wann wähle ich was?</strong></h2>
<p>Die Frage bei Fabric vs. Databricks ist nicht unbedingt &#8222;was ist besser?&#8220;. Beide Programme bieten fantastische Möglichkeiten, aber es hängt von Ihrem Unternehmen ab. Wenn Ihr Unternehmen in mehreren Clouds gleichzeitig vertreten ist, dann ist Databricks vermutlich besser geeignet. Selbiges gilt, wenn Real-Time Analytics mit Machine Learning in möglichst hoher Geschwindigkeit notwendig ist.</p>
<p>Die Vorzüge von Fabric sind aber auch ganz klar. Gerade wenn Ihr Unternehmen schon Erfahrung mit Azure hat und vielleicht sogar Power BI nutzt, dann ist der Umstieg auf Fabric sehr leicht. Durch die Integration verschiedenster Anwendungen in einer Plattform hat Microsoft einen riesigen Schritt nach vorne gemacht. Eine wichtige Anmerkung ist hier auch, dass Microsoft gerade sehr viele neue Updates und Features herausbringt und wir somit eine schnelle Entwicklung sehen. Databricks wird hier allerdings vermutlich bald nachziehen.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Unsere Spezialisten</strong></h2>
<p>Wir sind seit vielen Jahren Spezialisten für die gesamte Datenverarbeitung von der Speicherung, über die Analyse bis zum fertigen Bericht. Wenn Sie weitere Fragen <a href="/kontakt/">kontaktieren</a> Sie uns doch einfach.</p>
</div></div></div></div></div></div></section>
<p>Der Beitrag <a href="https://arelium.de/fabric-vs-databricks/">Fabric vs. Databricks</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Azure KI Studio</title>
		<link>https://arelium.de/azure-ki-studio/</link>
		
		<dc:creator><![CDATA[Joel Galla]]></dc:creator>
		<pubDate>Thu, 25 Apr 2024 16:28:48 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[KI]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<guid isPermaLink="false">https://arelium.de/?page_id=18631</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/azure-ki-studio/">Azure KI Studio</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_medium"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><p>Das Azure KI Studio ist Microsofts eigener Designer für Künstliche Intelligenzen. Mit dem KI-Studio können z.B. eigene Modelle auf ChatGPT Basis erstellt werden. Zusätzlich können auch Bild- und Video-KIs erschaffen werden.</p>
<p>Insgesamt kann das Azure KI Studio genutzt werden, um KI-gestützte Assistenten und Chatbots zu bauen. Dabei setzt Microsoft auf eine Vielzahl von KI-Modellen. Interessanterweise sind damit nicht nur hauseigene Modelle wie ChatGPT oder DALL-E gemeint, sondern auch Meta&#8217;s Llama kann verwendet werden. Somit kann man Modelle nach eigenem Geschmack auswählen und miteinander kombinieren. Außerdem hat man hier auch Zugriff auf alte und neue Modelle, die je nach Anwendungszweck und Preisvorstellung ausgewählt werden können.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Was kann das Azure KI Studio?</h3>
<p>Es ist vor allem dazu gedacht, Assistenten und KI-Lösungen für die eigenen Anwendungszwecke maßzuschneidern. Es geht dabei primär um Chatbots oder z.B. auch Coding Assistenten, welche auf die eigenen Gegebenheiten ausgerichtet werden. Zum Anpassen gehören dabei zudem auch die Verbindung mit eigenen Daten und auch einem Fine Tuning, um die beste Genauigkeit zu erreichen.</p>
</div></div></div></div></div></div></section><section class="l-section wpb_row height_small"><div class="l-section-overlay" style="background:var(--color-content-bg-alt)"></div><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="w-separator us_custom_c70c97eb size_small"></div><div class="wpb_text_column us_custom_c70c97eb"><div class="wpb_wrapper"><h3>Wie ist es aufgebaut?</h3>
<p>Bevor es weitergeht, welche Anwendungen sind eigentlich von Microsoft vorgesehen?</p>
</div></div><div class="w-separator us_custom_c70c97eb size_medium"></div><div class="g-cols wpb_row us_custom_c70c97eb via_grid cols_4 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default" style="--columns-gap:3rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h5><strong>Erstellen von KI-Assistenten</strong></h5>
<p>Hier kann man, wie man es auch schon von Azure OpenAI kennt, eine Verbindung mit einem GPT-Modell also, wie zum Beispiel ChatGPT aufbauen. Zudem kann man diese Sprachmodelle dann bspw. als Codinghilfen trainieren und unternehmensweit ausrollen.</p>
</div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h5><strong>Erstellen eines eigenen Co-Piloten</strong></h5>
<p>Copiloten sind schon für alle möglichen Anwendungen vorhanden, aber jetzt kann man einen speziell für sich bauen. Den Co-Piloten fehlt oft die Einsicht in die eigenen Daten. Mit dem Azure KI Studio kann man dieses Problem jetzt beheben.</p>
</div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h5><strong>Multimodalität</strong></h5>
<p>Ihrer App fehlt die menschliche Interaktion? Dann kann man hier diese Lücke schließen. Hier können Apps mit dem entsprechenden Chatinterface ausgerüstet werden.</p>
</div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h5><strong>Azure KI SDK</strong></h5>
<p>Der Zugriff über ein SDK (Software Development Kit), sodass die eigene Umgebung genutzt werden kann und man sich auf vertrautem Terrain bewegt.</p>
</div></div></div></div></div><div class="w-separator size_small"></div></div></div></div></div></section><section class="l-section wpb_row height_medium"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Warum sollte ich das Azure KI Studio nutzen?</h3>
<p>Was unterscheidet einen Chatbot vom Azure KI Studio von bspw. ChatGPT? Das zugrundeliegende Sprachmodell kann natürlich ChatGPT sein, aber die Konfigurationen machen den Unterschied. So kann durch einen Prompt z.B. festgelegt werden, dass nur Antworten gegeben werden, wenn die Informationen wirklich vorhanden sind. Außerdem kann auch eine Quellenangabe verlangt werden. Der wohl größte Unterschied zu der Internetseite, bei der man kostenlos mit ChatGPT chatten kann, ist die Verbindung mit eigenen Daten. Natürlich kann ChatGPT online nicht auf die eigenen Daten zugreifen, aber das Modell kann in Azure mit den eigenen Daten verbunden werden. Somit ist eine Sprachinteraktion mit passenden Antworten auf die eigenen Daten gewährleistet.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Was macht das Azure KI Studio besonders?</h3>
<p>Die herausragenden Eigenschaften vom Azure KI Studio sind die detaillierten Möglichkeiten. Es ist nicht die Lösung für einfache Probleme, bei denen Fehler passieren dürfen, sondern für die Probleme, die eine feinere bzw. detailliertere Lösung brauchen. Durch das Fine Tuning, die Anbindungen eigener Daten und den Prompt-Flow kann man hier an vielen Stellschrauben spielen und auch auf die kleinen Details achten.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Ein Anwendungsbeispiel</h3>
<p>Jeder kennt die Chatbots, die auf vielen Internetseiten vertreten sind. Die Chatbots sind meist recht simple gehalten und können aus einer vorgefertigten Anzahl an Antworten auswählen. Mit einem Sprachmodell kann man diese Bots jetzt drastisch verbessern. Ich würde jetzt die Anleitungen für leichtere Supportfälle hinterlegen und z.B. auch entsprechende Ansprechpartner für sehr spezifische Fälle. Dann gebe ich dem Bot die Anweisung, keine Mitbewerber zu nennen und einen besonders freundlichen Ton zu verwenden. Zusätzlich sollte die verwendete Sprache einfach sein.</p>
<p>Dieser Chatbot kann jetzt eingebunden werden und verbessert die User-Experience durch eine deutlich agilere und menschlichere Konversation.</p>
</div></div><div class="w-separator size_medium"></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default" style="--columns-gap:3rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="w-image align_none"><div class="w-image-h"><img decoding="async" width="700" height="450" src="https://arelium.de/wp-content/uploads/2024/04/450x700.png" class="attachment-full size-full" alt="Azure KI Studio erstellt" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2024/04/450x700.png 700w, https://arelium.de/wp-content/uploads/2024/04/450x700-300x193.png 300w, https://arelium.de/wp-content/uploads/2024/04/450x700-622x400.png 622w" sizes="auto, (max-width: 700px) 100vw, 700px" /></div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Kann ich Bilder automatisch generieren?</h3>
<p>Wie zu Beginn erwähnt, kann das Azure KI Studio auch z.B. DALL-E verwenden. Damit lassen sich z.B. bestimmte Stile bei Bildern im Voraus wählen, welche dann immer automatisch zum Generieren verwendet werden.</p>
</div></div></div></div></div><div class="w-separator size_medium"></div></div></div></div></div></section><section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Wie sieht die Zukunft aus?</h3>
<p>Das Azure KI Studio befindet sich zum Zeitpunkt dieses Artikels noch in der Vorschau. Deshalb können sich noch einige Dinge ändern. Gerade das KI-Umfeld wird derzeit rasant weiterentwickelt. Somit fließen neue Änderungen in das Azure KI Studio fast so schnell ein wie in <a href="/microsoft-fabric">Microsoft Fabric</a>. Der allgemeine Überblick, wie er hier gegeben wurde, bleibt dabei natürlich bestehen. Meiner persönlichen Einschätzung nach werden wir hier in Zukunft viele neue und leistungsfähigere Modelle sehen. Wir sind alle gerade noch am Anfang und dabei herauszufinden, wofür wir Sprachmodelle überall nutzen können. Gerade deshalb sollte man am besten jetzt schon mit kleineren Anwendungen anfangen. Wenn es einen großen Durchbruch bei der Verwendung gibt, möchte man ja nicht erst anfangen müssen zu lernen, wie das Tool selbst funktioniert.</p>
</div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Fazit</h3>
<p>Das Azure KI Studio ist ein unglaublich leistungsfähiges neues Werkzeug, welches gerade noch am Anfang steht. Anders als andere KI-Lösungen von Microsoft ist es jedoch deutlich komplizierter und spezialisierter, sodass es sich vor allem für sehr spezielle Probleme, bspw. jene mit einer kleinen Fehlertoleranz, eignet.</p>
</div></div></div></div></div></div></section>
<p>Der Beitrag <a href="https://arelium.de/azure-ki-studio/">Azure KI Studio</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>ML Studio vs Databricks</title>
		<link>https://arelium.de/ml-studio-vs-databricks/</link>
		
		<dc:creator><![CDATA[Tobias Adler]]></dc:creator>
		<pubDate>Tue, 15 Aug 2023 08:57:15 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Cloud]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[KI]]></category>
		<guid isPermaLink="false">https://arelium.de/?page_id=14909</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/ml-studio-vs-databricks/">ML Studio vs Databricks</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><p>Maschinelles Lernen (ML) ist heutzutage in viele Aspekte der Unternehmens-IT integriert. Zum Beispiel verwenden Unternehmen ML um die Datenanalyse zu beschleunigen, die Datenverarbeitung zu verbessern und die Entscheidungsfindung zu erleichtern. Microsoft <a href="/azure-machine-learning-studio/">Azure ML</a> und <a href="https://www.databricks.com/">Databricks</a> bieten beide erstklassige ML-Tools um diese Funktionen umzusetzen und haben wie üblich viele Gemeinsamkeiten und Unterschiede. Doch welcher Dienst eignet sich für Ihren Anwendungsfall am besten? Diese Frage behandeln wir im Folgenden Beitrag.</p>
</div></div><div class="w-separator size_medium"></div><h2 class="w-text"><span class="w-text-h"><span class="w-text-value">Azure ML vs Databricks Gemeinsamkeiten</span></span></h2><div class="wpb_text_column"><div class="wpb_wrapper"><p>Azure Machine Learning Studio (oder auch &#8222;ML Studio&#8220;) ist ein Teil des Azure-Ökosystems und wurde von Microsoft entwickelt, um sowohl Anfängern als auch erfahrenen Data Scientists den Einstieg in maschinelles Lernen zu erleichtern. Databricks ist eine unabhänige Firma, die von den ursprünglichen Schöpfern von Apache Spark gegründet wurde. Apache Spark ist ein Open-Source-Framework für Cluster-Computing, dass eine einfache Programmschnitstelle  für die verteilte Datenverarbeitung bietet. Databricks basiert auf Apache Spark und ist speziell für große Datenanalysen, maschinelles Lernen und fortschrittliche Datenverarbeitung optimiert. Da beide Tools über Funktionen zur Datenanalyse und -Verarbeitung verfügen, gibt es Überschneidungen der Funktionen der beiden Plattformen. Das sind die grundlegenden Gemeinsamkeiten zwischen ML Studio und Databricks:</p>
</div></div><div class="w-separator size_medium"></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1300" height="250" src="https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Gemeinsamkeiten.png" class="attachment-us_1300_400 size-us_1300_400" alt="Azure ML vs Databricks Gemeinsamkeiten" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Gemeinsamkeiten.png 1300w, https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Gemeinsamkeiten-300x58.png 300w, https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Gemeinsamkeiten-1024x197.png 1024w" sizes="auto, (max-width: 1300px) 100vw, 1300px" /></div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><ul>
<li><strong>Datenverarbeitung: </strong>Sowohl in der ML Studio-Entwicklung als auch auf der Databricks-Plattform spielt die Datenverarbeitung eine zentrale Rolle. Daten müssen häufig bereinigt, transformiert und aggregiert sein, bevor man sie mit ML-Modellen analysieren kann.</li>
<li><strong>Skalierbarkeit:</strong> Databricks basiert auf Apache Spark, einem Framework, mit dem man große Datenmengen in verteilten Umgebungen verarbeiten kann. Das maschinelle Lernen kann ebenfalls von dieser Skalierbarkeit profitieren, insbesondere bei großen Datensätzen oder komplexen Modellen. Auch ML Studio ist für das verarbeiten von großen Datenmengen ausgelegt. Durch die Elastischen Compute-Ressourcen ist es Benutzern möglich, ihre Compute instanzen je nach Bedarf zu skalieren. Außerdem integriert sich das ML Studio nahtlos in andere Azure Dienste, wie zum Beispiel den Azure Data Lake, welcher für die Speicherung von großen Datenmengen optimiert wurde.</li>
<li><strong>Integration von ML-Frameworks</strong>: Sowohl Databricks als auch ML Studio unterstützen eine breite Palette von Frameworks für maschinelles Lernen, einschließlich TensorFlow, Keras und PyTorch. Dies gibt den Benutzern Flexibilität und Auswahlmöglichkeiten, je nachdem, welches Framework sie für ihre Projekte bevorzugen.</li>
</ul>
</div></div><div class="w-separator size_medium"></div><h2 class="w-text"><span class="w-text-h"><span class="w-text-value">Azure ML vs Databricks Unterschiede</span></span></h2><div class="wpb_text_column"><div class="wpb_wrapper"><p>Obwohl es Überschneidungen in den Funktionen von Databricks und Azure ML Studio gibt, haben sie unterschiedliche Ursprünge, Stärken und Hauptzwecke. Die gemeinsame Verfügbarkeit beider Dienste in Azure ermöglicht es Benutzern, je nach Projektanforderungen und Vorlieben das passende Werkzeug auszuwählen. Das sind die grundlegenden Unterschiede der beiden Plattformen:</p>
</div></div><div class="w-separator size_medium"></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1300" height="250" src="https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Unterschiede.png" class="attachment-us_1300_400 size-us_1300_400" alt="Azure ML vs Databricks Unterschiede" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Unterschiede.png 1300w, https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Unterschiede-300x58.png 300w, https://arelium.de/wp-content/uploads/2023/08/Azure-ML-vs-Databricks-Unterschiede-1024x197.png 1024w" sizes="auto, (max-width: 1300px) 100vw, 1300px" /></div></div><div class="w-separator size_medium"></div><div class="w-hwrapper valign_top align_none"><div class="wpb_text_column us_custom_2875505c"><div class="wpb_wrapper"><p><span style="color: #b71234;"><strong>Ursprung und Hauptfokus:</strong></span> ML Studio ist ein von Microsoft entwickeltes Produkt und dient als integrierte Umgebung für maschinelles Lernen. Es ist benutzerfreundlich und zielt darauf ab, den Prozess des Trainings, Testens und Deployments von ML-Modellen zu vereinfachen. Databricks ist ein Unternehmen das von den Schöpfern von Apache Spark entwickelt wurde und ist somit auf die Big Data-Verarbeitung und Analyse mit Spark ausgerichtet.</p>
</div></div><div class="wpb_text_column us_custom_2875505c"><div class="wpb_wrapper"><p><strong><span style="color: #b71234;">Benutzeroberfläche:</span> </strong>ML Studio bietet eine Drag-and-Drop-Oberfläche, die es besonders für Einsteiger einfach macht, Daten zu verarbeiten und ML-Modelle zu erstellen. Databricks verwendet für die Datenanalyse und das maschinelle Lernen hauptsächlich interaktive Notebooks. Das macht es für die Entwickler und Data Scientists sehr flexibel.</p>
</div></div></div><div class="w-hwrapper valign_top align_none"><div class="wpb_text_column us_custom_2875505c"><div class="wpb_wrapper"><p><span style="color: #b71234;"><strong>Datenverarbeitung</strong>:</span> Auch wenn ML Studio die Fähigkeit zur Datenverarbeitung und -transformation bietet, ist sein Hauptaugenmerk auf das maschinelle Lernen ausgerichtet. Als eine auf Spark basierende Plattform steht Databricks wiederum an der Spitze der Tools für die Verarbeitung und Analyse großer Datenmengen.</p>
</div></div><div class="wpb_text_column us_custom_2875505c"><div class="wpb_wrapper"><p><span style="color: #b71234;"><strong>Deployment: </strong></span>ML Studio bietet integrierte Tools für das Deployment von ML-Modellen als Webdienste innerhalb des Azure-Ökosystems. Bei Databricks gibt es zwar Möglichkeiten für das Deployment, dennoch benötigt man oft eine Integration mit anderen Azure Diensten, um Modelle in Produktion zu bringen.</p>
</div></div></div><div class="w-separator size_medium"></div><h2 class="w-text"><span class="w-text-h"><span class="w-text-value">Fazit</span></span></h2><div class="wpb_text_column"><div class="wpb_wrapper"><p>Zusammenfassend lässt sich sagen, dass sowohl Azure Databricks als auch ML Studio leistungsstarke Werkzeuge im Arsenal eines Data Scientist sind. Während Databricks mit seiner Spark-Integration und Fähigkeit zur Verarbeitung von Big Data besonders punktet, bietet ML Studio eine intuitive Benutzeroberfläche und eine End-to-End-Plattform für den maschinellen Lernzyklus. Obwohl es Gemeinsamkeiten wie die Fähigkeit zur Durchführung von ML-Operationen gibt, zeichnen sie sich durch unterschiedliche Stärken und Anwendungsfälle aus. Die Wahl zwischen den beiden hängt letztlich von den spezifischen Anforderungen, Datenmengen und dem gewünschten Workflow eines Projekts ab. Wenn es sich um ein Projekt mit sehr großen Datenmengen handelt, bietet sich Databricks als Plattform für die Datenanalyse an. Handelt es sich aber um ein Projekt, bei dem Sie möglichst schnell einen Prototyp erstellen müssen, dann wäre ML Studio das Tool der Wahl.</p>
</div></div><div class="w-separator size_medium"></div><h2 class="w-text"><span class="w-text-h"><span class="w-text-value">Unsere Spezialisten</span></span></h2><div class="wpb_text_column"><div class="wpb_wrapper"><p>Wir von arelium haben viel Erfahrung im Bereich der Big-Data Verarbeitung und -analyse. Unsere Experten haben schon sowohl Kunden bei der Analyse von großen Datenmengen mit Databricks, als auch bei dem erstellen von Prototypen für ML-Modelle mit ML Studio unterstützt. Sie verfügen in ihrem Unternehmen über große Datenmengen und wollen noch mehr Informationen aus diesen Daten ziehen? Sprechen Sie uns an und unsere Experten helfen Ihnen gerne weiter.</p>
</div></div></div></div></div></div></section>
<p>Der Beitrag <a href="https://arelium.de/ml-studio-vs-databricks/">ML Studio vs Databricks</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Data Analytics</title>
		<link>https://arelium.de/data-analytics-wiki/</link>
					<comments>https://arelium.de/data-analytics-wiki/#respond</comments>
		
		<dc:creator><![CDATA[Tobias Adler]]></dc:creator>
		<pubDate>Thu, 27 Apr 2023 10:00:36 +0000</pubDate>
				<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Data Analytics]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Microsoft Power BI]]></category>
		<category><![CDATA[Power BI]]></category>
		<guid isPermaLink="false">https://arelium.de/?p=14054</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/data-analytics-wiki/">Data Analytics</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Mit Data Analytics die richtigen Entscheidungen treffen!</h2>
<p>In der heutigen Zeit fallen bei Unternehmen riesige Massen an Daten an. Data Analytics beschäftigt sich mit der Analyse dieser Daten, um den größten Nutzen aus ihnen zu ziehen. Die Massen an Daten in Unternehmen wird immer größer. Es gibt verschiedene Methoden, die diese großen Mengen an Daten analysieren können.</p>
<p>Um die Unternehmensdaten zu analysieren und so das meiste aus den Daten rauszuholen gibt es verschiedene Ansätze. Wir arbeiten z.B. an der Datenbereitstellung, der Datenvisualisierung, der statistische Analyse, dem maschinelle Lernen und dem Datamining. Mit der Datenvisualisierung können beispielsweise Daten in ansprechenden Formaten dargestellt werden, um Muster in Datensätzen zu veranschaulichen. Erst die Darstellung von Daten ermöglicht es neue Möglichkeiten zu sehen und weitere Analysen anzustoßen.</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Datenvisualisierung</h2>
<p>Durch Datenvisualisierung können komplexe Daten ansprechend und leicht verständlich präsentiert werden. Oftmals sind die Ergebnisse von Analysemethoden visualisiert. Dadurch können Benutzer Abhängigkeiten und Zusammenhänge zwischen verschiedenen Variablen, Abweichungen und Außreisern erkennen. Außerdem entstehen bessere Entscheidungen im Team, weil die Visualisierung der Daten die Kommunikation und Zusammenarbeit von Kollegen und Abteilungen verbessert. Für die Datenvisualisierung gibt es verschiedene Tools, wie zum Beispiel Tableau, Qlik View und Power BI .</p>
<p>Alle drei sind Tools um Daten zu visualisieren, dennoch haben alle Tools unterschiedliche Stärken und Schwächen. Qlik View ist aufgrund seiner Komplexität eher schwieriger zu erlernen. Tableau und <span style="color: black;">Power BI</span> hingegen sind für ihre Benutzerfreundlichkeit und einfache Bedienung bekannt. Trotzdem stehen <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/power-bi/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Power BI&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Microsoft Power BI?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Power BI glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;Power BI ist eine Business Intelligence-Plattform von Microsoft, die es Anwendern ermöglicht, Daten aus(...)&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Power BI</span></a> und Tableau QlikView in den Punkten Datenanalyse und Datenvisualisierung in nichts nach. Alle drei Tools bieten eine Vielzahl an Datenanalyse- und Datenvisualisierungsfunktionen.</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Datenvisualisierung mit Power BI</h3>
<p style="margin: 0cm; box-sizing: border-box;">Mit modernen Tools wie <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/power-bi/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Power BI&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Microsoft Power BI?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Power BI glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;Power BI ist eine Business Intelligence-Plattform von Microsoft, die es Anwendern ermöglicht, Daten aus(...)&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Power BI</span></a> lassen sich immer bessere Berichte erstellen. Natürlich können Farben und Highlights genutzt werden um den Leser sinnvoll durch die Berichte zu leiten. Zudem sind die interaktiven Möglichkeiten hilfreich, um ganz neue und tiefere Einblicke in die Daten zu gewinnen.</p>
</div></div><div class="w-separator size_small"></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1024" height="546" src="https://arelium.de/wp-content/uploads/2023/03/PowerBI-Screenshot-1024x546.png" class="attachment-large size-large" alt="PowerBI Screenshot Data Analytics" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/03/PowerBI-Screenshot-1024x546.png 1024w, https://arelium.de/wp-content/uploads/2023/03/PowerBI-Screenshot-300x160.png 300w, https://arelium.de/wp-content/uploads/2023/03/PowerBI-Screenshot-750x400.png 750w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Statistische Analyse</h2>
<p>Die statische Analyse bezieht sich im Bereich der <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/data-analytics/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Data Analytics&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Data Analytics?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Data Analyst_Data Analytics glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;&lt;span data-contrast=&quot;auto&quot;&gt;Data Analytics bezieht sich auf die Anwendung von Techniken und Tools, um Daten zu sammeln, zu analysieren und(...)&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Data Analytics</span></a> darauf, Muster und Trends in Datensätzen zu identifizieren. Im nächsten Schritt trifft man auf diesen Erkenntnissen fundierte Entscheidungen und Vorhersagen. Zur statistischen Analyse von Daten gibt es mehrere Ansätze. Mit der deskriptiven Statistik werden die Daten durch statistische Maße wie Mittelwert, Varianzen und Standardabweichungen beschrieben und zusammengefasst.</p>
<h3>Deskriptive Statistik</h3>
<p>Sie beschäftigt sich mit der Schätzung von Parametern, um Rückschlüsse auf die Gesamtheit zu ziehen. Hierzu zieht man Stichproben aus der Gesamtheit. Ein Parameter ist eine charakteristische Eigenschaft der Gesamtheit, wie zum Beispiel der Mittelwert oder die Standardabweichung. Mit altbewehrten Mitteln wie dem <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/hypothesentest/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Hypothesentest&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist ein Hypothesentest?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/04/Hypothesentest.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Hypothesentest&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/04/Hypothesentest.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/04/Hypothesentest-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/04/Hypothesentest-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;Der Hypothesentest ist ein wichtiger Schritt in der Inferenzstatistik. Er ist ein statistischer Test, um zu(...)&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Hypothesentest</span></a> oder der <span style="color: black;">Regressionsanalyse</span> kann man erste Analysen durchführen. Diese Analysen liefern oft schon fundamentale und nützliche Ergebnisse, aber in der Praxis ist mit noch ausgereifteren Methoden mehr möglich.</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Statistische Analyse in der Cloud</h2>
<p style="margin: 0cm; box-sizing: border-box;">Die immer größere Rechenleistung und Verfügbarkeit von Daten ermöglicht es auch vollautomatisierte Auswertungen für Unternehmen zu designen. Mehr und mehr Unternehmen erkennen diesen Umstand und so wird es immer wichtiger fortgeschrittene Techniken anzuwenden. Somit ist man der Konkurrenz immer einen Schritt voraus. Deshalb haben wir noch weitere Teilgebiete vorbereitet.</p>
<p>&nbsp;</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Data Mining</h2>
<p>Eine weitere <a href="/glossar/data-analytics/">Data Analytics</a> Technik, um Muster und Zusammenhänge in großen Datenmengen zu erkennen, ist das <a href="/glossar/data-mining/">Data Mining</a>. Data Mining beinhaltet somit die Anwendung von statistischen und mathematischen Techniken. Die Anwendung von künstlicher Intelligenz und Machine Learning spielen dabei eine entscheidende Rolle. Der Prozess des <a href="/glossar/data-mining/">Data Mining</a> besteht aus folgenden Schritten:</p>
<p><strong>Datenauswahl</strong></p>
<p>Der erste Schritt im <a href="/glossar/data-mining/">Data Mining</a>-Prozess besteht darin, die relevanten Daten aus einer großen Datenmenge auszuwählen. Dieser Schritt ist wichtig, da er sicherstellt, dass zur Analyse nur relevante und geeignete Daten bereitstehen, was Zeit und Ressourcen spart.</p>
<p><strong>Datenvorbearbeitung</strong></p>
<p>Die Datenvorbereitung ist ein wichtiger Schritt um die Rohdaten in eine geeignete Form zu bringen, damit sie für die Datenanalyse bereit sind.</p>
<p><strong>Datenreinigung</strong></p>
<p>Im nächsten Schritt werden die ausgewählten Daten auf Fehler und Inkonsistenzen überprüft. Infolgedessen behebt man diese. Die Datenreinigung kann manuell oder automatisch erfolgen.</p>
</div></div><div class="w-separator size_small"></div><div class="w-vwrapper align_none valign_top"><div class="w-separator size_small"></div></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="824" height="717" src="https://arelium.de/wp-content/uploads/2023/03/Data-Mining-vs-Data-Analytics.png" class="attachment-large size-large" alt="Data Mining vs Data Analytics" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/03/Data-Mining-vs-Data-Analytics.png 824w, https://arelium.de/wp-content/uploads/2023/03/Data-Mining-vs-Data-Analytics-300x261.png 300w, https://arelium.de/wp-content/uploads/2023/03/Data-Mining-vs-Data-Analytics-460x400.png 460w" sizes="auto, (max-width: 824px) 100vw, 824px" /></div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2><strong>Data Analytics</strong></h2>
<p>Die Datenanalyse ist der wichtigste Schritt im Data-Mining-Prozess, bei dem die vorverarbeiteten Daten untersucht werden, um Muster, Zusammenhänge und Erkenntnisse zu identifizieren. Es gibt verschiedene Ansätze bei der Datenanalyse. Zum Beispiel können wir, in der Praxis, die Daten mithilfe eines Künstlichen Neuronalen Netzes (KNN) analysieren. Ein KNN ist ein mathematisches Modell, das aus einer großen Anzahl von miteinander verbundenen Neuronen besteht, die in Schichten organisiert sind. Jedes Neuron nimmt Eingabedaten auf, verarbeitet sie und gibt sie an das nächste Neuron weiter. Das Netz benötigt zum trainieren eine große Menge an Trainingsdaten. Dann werden die echten Daten in die Eingabeschicht des KNN eingespeist und von dort durch die Verarbeitungsschichten geleitet.</p>
<h3>Wie funktioniert das KNN eigentlich?</h3>
<p>Jedes Neuron wendet beim Empfangen der Daten eine Aktivierungsfunktion an. Dadurch wird die Summe der gewichteten Eingabedaten des Neurons in einen Wert transformiert. Dieser Wert wird dann an die nächste Schicht weitergegeben. Während des Trainingsprozesses wird die Rückgabepropagation verwendet, um die Gewichte der Verbindung zwischen den Neuronen zu aktualisieren und dadurch die Vorhersagegenauigkeit zu verbessern. Zum Schluss werden die Werte an die Ausgabeschicht gegeben, wo sie dem Nutzer in einer verständlichen Form präsentiert werden.</p>
</div></div><div class="w-separator size_small"></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1024" height="461" src="https://arelium.de/wp-content/uploads/2023/02/Big-Data-1024x461.jpeg" class="attachment-large size-large" alt="Azure Synapse Analytics Big Data" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/02/Big-Data-1024x461.jpeg 1024w, https://arelium.de/wp-content/uploads/2023/02/Big-Data-300x135.jpeg 300w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Machine Learning</h2>
<p><strong>Ein weiterer Data Analytics Ansatz ist Machine Learning. </strong>Im Wesentlichen geht es darum, einen Algorithmus so zu trainieren, dass es automatisch aus Vorhersagen und Entscheidungen treffen kann. Dieses Verfahren wird oft von Kunden nachgefragt. Es hilft um besser zu verstehen, man Kosten sparen und Gewinne machen kann.<br />
Wie auch bei der Datenanalyse mit einem Künstlichen Neuronalen Netz ist auch hier der erste Schritt die Sammlung und Bereinigung von Rohdaten. Danach werden die wichtigsten Merkmale der Daten identifiziert und ein Modell erstellt. Mit diesem kann man die Beziehung zwischen den Merkmalen und dem Ziel der Analyse beschreiben.<br />
Ein mögliches Modell ist zum Beispiel das <a href="https://www.microsoft.com/en-us/research/theme/reinforcement-learning-group/">Reinforcement Learning</a>. Bei dieser Methode lernt der Algorithmus in einer bestimmten Umgebung Entscheidungen zu treffen, um einen Belohnungswert zu Maximieren. Auf diese Weise lernt der Algorithmus selber, welche Aktionen in einer bestimmten Situation am besten sind. Außerdem kann er abschätzen, mit welchen Aktionen er seine Aussagen optimieren kann.</p>
<h2>Beispiel Reinforcement Learning</h2>
<p>Kommen wir zu einem Beispiel für Reinforcement Learning. Ein Unternehmen möchte den optimalen Preis für seine Produkte bestimmen. Der RL-Agent würde in diesem Fall die Daten analysieren, um den Preis zu finden. Dieser führt dann zu einer maximalen Belohnung (in diesem Fall zu einem höheren Umsatz). Der RL-Agent würde dann seine Entscheidungen verbessern, indem er die Auswirkungen seiner Aktionen auf die Belohnung analysiert. Auf Basis dieser Analyse kann er dann bessere Entscheidungen treffen.</p>
<p>Eine benutzerfreundliche Möglichkeit diese Modelle zu erstellen ist z.B. das ML-Studio von Microsoft. Unser Data Engineer Emil Vincazovic hat auch dazu schon einen <a href="/azure-machine-learning-studio/">Blog-Beitrag</a> verfasst.</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Fazit</h2>
<p style="margin: 0cm;"><a href="/glossar/data-analytics/" target="_blank" rel="noopener"><span style="color: black;">Data Analytics</span></a> ist schon seit langem ein wichtiger Bestandteil der Business Welt. Neue Technologien wie <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/power-bi/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Power BI&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Microsoft Power BI?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Power BI glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Power-BI-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;Power BI ist eine Business Intelligence-Plattform von Microsoft, die es Anwendern ermöglicht, Daten aus(...)&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Power BI</span></a> und allem voran auch Machine Learning ermöglichen es immer bessere Ergebnisse zu erzielen. Mit dem richtigen Fachwissen oder der richtigen Hilfe an Ihrer Seite, können völlig neue Möglichkeiten entstehen. In der modernen Welt kriegen Unternehmen Probleme wenn sie sich nicht mit <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/data-analytics/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Data Analytics&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Data Analytics?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Data Analyst_Data Analytics glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;&lt;span data-contrast=&quot;auto&quot;&gt;Data Analytics bezieht sich auf die Anwendung von Techniken und Tools, um Daten zu sammeln, zu analysieren und(...)&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Data Analytics</span></a> auseinander setzen.</p>
</div></div><div class="w-separator size_small"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Unsere Spezialisten</h2>
<p style="margin: 0cm;">Wir, als arelium, haben über ein <a href="/synapse-analytics-experten/">Jahrzehnt Erfahrung</a> mit <a style="box-sizing: border-box; transition-property: background, box-shadow, border, color, opacity, transform; transition-duration: 0.3s; outline: none !important;" href="/glossar/data-analytics/" target="_blank" rel="noopener" describedby="tt" cmtooltip="&lt;div class=glossaryItemTitle&gt;Data Analytics&lt;/div&gt;&lt;div class=glossaryItemBody&gt;&lt;section class=&quot;l-section wpb_row height_small&quot;&gt;&lt;div class=&quot;l-section-h i-cf&quot;&gt;&lt;div class=&quot;g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default&quot;&gt;&lt;div class=&quot;wpb_column vc_column_container&quot;&gt;&lt;div class=&quot;vc_column-inner&quot;&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;Was ist Data Analytics?&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;w-image align_none&quot;&gt;&lt;div class=&quot;w-image-h&quot;&gt;&lt;img width=&quot;1300&quot; height=&quot;400&quot; src=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png&quot; class=&quot;attachment-us_1300_400 size-us_1300_400&quot; alt=&quot;Data Analyst_Data Analytics glossarbild&quot; decoding=&quot;async&quot; loading=&quot;lazy&quot; srcset=&quot;https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics.png 1300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-300x92.png 300w, https://areliumgmbh.live-website.com/wp-content/uploads/2023/03/Data-Analyst_Data-Analytics-1024x315.png 1024w&quot; sizes=&quot;(max-width: 1300px) 100vw, 1300px&quot; /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;w-separator size_medium&quot;&gt;&lt;/div&gt;&lt;div class=&quot;wpb_text_column&quot;&gt;&lt;div class=&quot;wpb_wrapper&quot;&gt;&lt;strong&gt;Definition&lt;/strong&gt;&lt;span data-contrast=&quot;auto&quot;&gt;Data Analytics bezieht sich auf die Anwendung von Techniken und Tools, um Daten zu sammeln, zu analysieren und(...)&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/div&gt;&lt;/section&gt;&lt;/div&gt;" attributes="&#091;{&quot;attribute&quot;:&quot;data-cmtooltip&quot;, &quot;format&quot;:&quot;html&quot;}&#093;"><span style="color: black;">Data Analytics</span></a> Lösungen wie z.B. mit Machine Learning. In vielen einzelnen Projekten haben wir die Möglichkeiten von Machine Learning nutzen können, um Kunden maßgeschneiderte Lösungen zu präsentieren. Wenn Sie neugierig geworden sind sprechen Sie uns gerne an. Somit können wir Ihnen helfen zu verstehen wie Sie optimal von dieser Technologie profitieren können.</p>
</div></div></div></div></div></div></section>
<p>Der Beitrag <a href="https://arelium.de/data-analytics-wiki/">Data Analytics</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/data-analytics-wiki/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Azure Machine Learning Studio</title>
		<link>https://arelium.de/azure-machine-learning-studio/</link>
					<comments>https://arelium.de/azure-machine-learning-studio/#respond</comments>
		
		<dc:creator><![CDATA[Emil Vincazovic]]></dc:creator>
		<pubDate>Thu, 06 Apr 2023 10:00:18 +0000</pubDate>
				<category><![CDATA[Azure]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Data Analytics]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Azure Machine Learning]]></category>
		<guid isPermaLink="false">https://arelium.de/?p=12780</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning Studio</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="w-text us_custom_0f35a564 no_text"><span class="w-text-h"><span class="w-text-value"></span></span></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Das Azure Machine Learning Studio</h2>
<p><strong>Das Azure ML Studio ist ein cloudbasiertes ML-Framework. In der von Microsoft zur Verfügung gestellten Umgebung ist es leicht möglich, ML-Pipelines aufzubauen</strong>. Die Plattform bietet eine intuitive grafische Oberfläche. Somit ist es auch unerfahrenen Benutzern möglich, ML-Projekte zu erstellen. Das Framework ist sehr flexibel. und vor allem die Auswahl der Verbindungen ist enorm groß. Zusätzlich zu den gängigen Datenquellen wie bswp. dem SQL Server, besteht die Möglichkeit, alle Azure Dienste an das ML-Studio anzubinden. Da es ein Clouddienst ist, besteht außerdem kein Problem mit der Skalierung. Wenn Modelle umfangreicher werden oder die Datenmenge sich erhöht, kann man problemlos die Rechenressourcen der Cloud skalieren. Mehr zur vertikalen und horizontalen Skalierung, gibt es in dem <a href="/azure-synapse-analytics/">Blogbeitrag zu Azure Synapse Analytics.</a></p>
<p>Auch der Nachteil der langen Rechenzeit von ML-Modellen wird mit dem Machine Learning Studio sehr gut aufgefangen. Dadurch, dass man verschiedene Compute-Instanzen und sogar Compute-Cluster erstellen kann, wird die Rechenzeit reduziert. Die Kosten steigen jedoch mit gestiegener Rechenpower an.</p>
</div></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Machine Learning</h3>
<p>Machine Learning ist ein Teilgebiet der künstlichen Intelligenz. Es hat die Fähigkeit durch Erfahrung und Beispiele Aufgaben zu erledigen, ohne dass man den Algorithmus explizit auf eine Aufgabe programmiert hat. Die Algorithmen erkennen Muster innerhalb der Daten. Ein einfaches Beispiel des Machine Learning ist die Betrugserkennung bei Bankdaten. Da Machine Learning Algorithmen meist mit strukturierten Daten arbeiten, bieten sich Bankdaten an. Aber auch Vorhersagemodelle lassen sich mit dem Machine Learning wunderbar entwickeln. So könnte beispielsweise die Frage beantwortet werden, wie viel ein Kunde für ein bestimmtes Produkt bereit wäre zu bezahlen.</p>
<p>Prinzipiell wird das Machine Learning in drei Hauptkategorien unterteilt:</p>
<ol>
<li>Überwachtes Lernen (Supervised Learning)</li>
<li>Unüberwachtes Lernen (Unsupervised Learning)</li>
<li>Verstärkendes Lernen (Reinforcement Learning)</li>
</ol>
<p>Wann welche Kategorie eingesetzt wird ist abhängig von der Datenlage und dem zu analysierenden Vorhaben.</p>
<ol>
<li><strong>Überwachtes lernen</strong><br />
Bei dem überwachtem Lernen nutzt der Algorithmus bekannte Daten, um daraus Muster und Zusammenhänge zu erkennen. Wichtig hierbei ist zu erwähnen, dass der Algorithmus immer im Zusammenhang mit einer Zielvariable lernt. Diese Zielvariable versucht der Algorithmus richtig vorauszusagen. Dabei kann es sich um eine Klasse oder um einen numerischen Wert handeln.<br />
<strong>Beispiele für überwachtes Lernen sind</strong> Risikobewertungen, Kundenprognosen oder Klassifizierungen.</li>
<li><strong>Unüberwachtes Lernen</strong><br />
Bei dem unüberwachtem Lernen bekommt der Algorithmus keine Trainingsdaten. Er soll anhand von dem gesamten Datensatz interessante Zusammenhänge oder auch versteckte Gruppen entdecken. Der Unterschied zum überwachtem Lernen ist, dass das Unsupervised Learning nicht darauf ausgelegt ist eine Vorhersage zu treffen. Somit ist es deutlich schwieriger das Modell am Ende zu bewerten. Es bleibt nichts anderes übrig, als anhand von sogenannten &#8222;weichen Faktoren&#8220; das Ergebnis zu interpretieren.<br />
<strong>Beispiele für unüberwachtes Lernen sind</strong> Clusteranalysen, Visualisierungen von großen Datenmengen oder auch Erstellung von ML-Features.</li>
<li><strong>Verstärkendes Lernen</strong><br />
Das verstärkende Lernen ist eine ganz besondere Form des Machine Learning. Hier interagiert ein Algorithmus mit seiner Umgebung. Daraufhin wird er von einer Kostenfunktion bzw. eines Belohnungssystems bewertet. Im Anschluss an die Bewertung soll der Algorithmus selbstständig eine Strategie zur Lösung des Problems erlernen. Somit kann der Algorithmus die Belohnung selbstständig maximieren. Es wird von Anfang an nicht gezeigt, welche Aktion die Richtige ist. Durch viele iterative Durchläufe lernt der Algorithmus selbstständig die beste Lösung.<br />
<strong>Beispiele für das verstärkende Lernen sind </strong>Spiel-KIs, Einsatz in der Robotik oder auch autonome Fahrzeuge.</li>
</ol>
</div></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Grobes Schema eines ML Prozesses</h3>
<p>Um die Funktionen des Machine Learning Studios zu verstehen, sollte man sich erst einmal über den Prozess in einer ML-Pipeline Gedanken machen. Im Folgenden wird das Schema eines ML-Prozesses vorgestellt. Zu den Unterpunkten wird die Verbindung zu anderen Azure Ressourcen gezogen. Des Weiteren gibt es einige Erklärungen was während den Schritten passiert.</p>
</div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>1. Rohdaten importieren</strong></span></h4>
<p>Zu Beginn einer ML-Pipeline importiert man die Rohdaten.</p>
<p>Hierbei besteht beispielsweise die Möglichkeit auf eine csv-Datei in einem Azure Blob Storage bzw. einem Data Lake zuzugreifen. Auch die Nutzung einer Azure SQL Datenbank ist möglich.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_f124cc4d has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container us_custom_3585c534 has_bg_color"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>2. Daten bearbeiten</strong></span></h4>
<p>Im nächsten Schritt müssen die Daten bearbeitet werden. Dies liegt hauptsächlich daran, dass ein ML-Algorithmus nur numerische Werte akzeptiert. Somit muss man die Datentypen anpassen. Außerdem skaliert man die Werte, um Verzerrungen in den Ergebnissen zu minimieren.</p>
<p>Hier besteht die Möglichkeit bei komplizierten Datenbearbeitungen Azure Synapse Analytics Notebooks zu nutzen. Die Azure Data Factory könnte man bspw. bei einfacheren Data Flows nutzen.</p>
</div></div></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>3. Splitten in Trainings-, Test- und Validierungsdaten</strong></span></h4>
<p>Im nächsten Schritt muss der nun saubere Datensatz aufgeteilt werden. Wir benötigen einen Trainings-, einen Test- und einen Validierungsdatensatz.</p>
<p>Das Splitten in verschiedene Datensätze kann theoretisch auch mit den beiden Azure Tools Synapse oder der Data Factory erfolgen. Allerdings kann dies auch im Machine Learning Studio passieren.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_cd236f14 has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container us_custom_709e5fb1 has_bg_color"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>4. Algorithmus wählen</strong></span></h4>
<p>Je nach Anwendungsfall sollte man sich im Voraus schon Gedanken über den Algorithmus machen. Handelt es sich beispielsweise um ein Klassifizierungsproblem, fallen einige Algorithmen automatisch raus.</p>
<p>Die endgültige Entscheidung über den Algorithmus sollte im Azure ML Studio getroffen werden. Dort werden viele Hilfestellungen zur Wahl angeboten. Außerdem kann es passieren, dass wenn man einen speziellen Algorithmus nutzen will, dieser in einigen Funktionen des Frameworks nicht gegeben ist.</p>
</div></div></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>5. Trainieren des Modells</strong></span></h4>
<p>Das Modell wird mit den in Schritt 3 generierten Trainingsdaten trainiert. Somit &#8222;gewöhnen&#8220; wir den Algorithmus an unsere Daten.</p>
<p>Dieser Schritt erfolgt ausschließlich im Azure Machine Learning Studio.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_0152a0bf has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container us_custom_76b51f45 has_bg_color"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>6. Testen des Modells</strong></span></h4>
<p>Das trainierte Modell aus Schritt 5, wird mit den in Schritt 3 generierten Testdaten getestet. Die Performancebewertung des Modells steht hierbei im Vordergrund.</p>
<p>Auch diesen Schritt führt man ausschließlich im Azure Machine Learning Studio durch.</p>
</div></div></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>7. Validieren des Modells</strong></span></h4>
<p>Das getestete Modell aus Schritt 6 wird nun mit den in Schritt 3 generierten Validierungsdaten validiert. Damit kann man sicherstellen, dass der Algorithmus nicht zu sehr an die Test- bzw. die Trainingsdaten angepasst ist und eine Verallgemeinerungsfähigkeit noch existiert.</p>
<p>Auch die Validierung des Modells erfolgt im Azure Machine Learning Studio. Dieser Schritt wird teilweise automatisch vom Framework ausgeführt.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_9a19dcbd has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container us_custom_36d4a751 has_bg_color"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>8. Weiteres Training / Deployment</strong></span></h4>
<p>Fällt das Ergebnis der Validierung (Schritt 7) positiv aus, sollte man das Modell einsetzen. Sowohl bei einem positivem als auch bei einem negativen Ergebnis muss das Modell weiter trainiert werden. Mit zunehmender Zeit und zusätzlichem Training verbessert sich das Modell.</p>
<p>Das weitere Training findet im ML-Studio statt. Auch das Deployment kann darüber erfolgen.</p>
</div></div></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><p>&nbsp;</p>
<h4><span style="color: #b71234;"><strong>9. Nutzung des Modells</strong></span></h4>
<p>Die Nutzung des Modells kann überall erfolgen.</p>
<p>Es bietet sich an, das Modell vor allem in die Analysedienste Synapse und die Azure Data Factory einzubinden. Aber auch eine Verbindung zu Power BI oder anderen Microsoft Tools ist einfach möglich.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_529071f5 has_bg_color"><div class="vc_column-inner"></div></div></div><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"></div><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default" style="--columns-gap:3rem;"></div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Die drei Varianten zum Aufsetzen einer Pipeline</h3>
<p>Im Azure ML Studio gibt es 3 Möglichkeiten eine Pipeline aufzusetzen. Im Folgenden sieht man die drei Varianten.</p>
</div></div><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>Automatisiertes ML</strong></span></h4>
<p>Das Auto-ML Feature im Azure ML-Studio kann jedermann benutzen. Die Erstellung einer ML-Pipeline erfolgt hier über ein Durchklicken durch ein Menü. Dabei benötigt man kein Vorwissen zur Nutzung. Schritte 1-8 übernimmt das Auto-ML Feature automatisch. Es gilt einige Dinge zu beachten: Zum einen muss man die Verbindung vom Azure ML Studio mit dem richtigen Speicherkonto herstellen können. Zum Anderen ist die Entscheidung wichtig, welche Metriken wichtig für das Ergebnis sind. Des Weiteren sollte man Verständnis für die Metriken und andere Probleme, wie bspw. das Problem des unbalancierten Datensatzes, haben.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_f8437273 has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default" style="--columns-gap:3rem;"></div><div class="g-cols wpb_row via_grid cols_2 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>Designer</strong></span></h4>
<p>Mit dem Designer kann man per Drag-and-Drop eine ML-Pipeline aufsetzen. Allerdings ist es hier problematischer als beim Auto-ML Feature. Da ein ML-Algorithmus nur numerische Werte akzeptiert, muss man die Daten vorher umwandeln. Diese Möglichkeit besteht jedoch im Designer nur bedingt! Somit sollte man die Daten vorher bearbeiten. Hier kommen, wie oben erwähnt, einige andere Azure Produkte zum Einsatz.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_548e099f has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="g-cols wpb_row via_grid cols_custom laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_middle type_default reversed stacking_default" style="--columns-gap:0rem;"></div><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h4><span style="color: #b71234;"><strong>Notebooks</strong></span></h4>
<p>Die Notebooks sind die mit Abstand mächtigste Variante im Azure ML Studio um eine ML-Pipeline aufzusetzen. Hier sind dem Anwender keine Grenzen gesetzt. Allerdings benötigt man hier viele Fähigkeiten. Sowohl theoretisches Wissen über die Funktion im ML als auch Programmierkenntnisse in Python sind hier notwendig. Der Vorteil ist, dass man Schritte 1-8 in den Notebooks ohne Probleme durchführen kann. Man benötigt lediglich noch die Verbindung zu einem Speicherkonto in Azure.</p>
</div></div></div></div><div class="wpb_column vc_column_container us_custom_30cadf3b has_bg_color"><div class="vc_column-inner"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div><div class="wpb_text_column"><div class="wpb_wrapper"></div></div></div><div class="wpb_text_column"><div class="wpb_wrapper"><p>Im Folgenden ist eine Tabelle mit den Vor- und Nachteilen der verschiedenen Varianten zu sehen. Es gilt zu beachten, dass hier bei weitem nicht alle Punkte aufgelistet sind. Die Tabelle dient lediglich als kleine Zusammenfassung der wichtigsten Eigenschaften der drei Varianten.</p>
</div></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="1024" height="196" src="https://arelium.de/wp-content/uploads/2023/03/Tabelle-Vor_Nachteile-Auto-ML-Designer-Notebooks-1024x196.png" class="attachment-large size-large" alt="Tabelle Vor_Nachteile Auto ML Designer Notebooks" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/03/Tabelle-Vor_Nachteile-Auto-ML-Designer-Notebooks-1024x196.png 1024w, https://arelium.de/wp-content/uploads/2023/03/Tabelle-Vor_Nachteile-Auto-ML-Designer-Notebooks-300x57.png 300w, https://arelium.de/wp-content/uploads/2023/03/Tabelle-Vor_Nachteile-Auto-ML-Designer-Notebooks.png 1300w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></div></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3></h3>
<h3>Ein beispielhafter ML-Workflow:</h3>
<p>Wie oben erwähnt, führen bei einer ML-Pipeline viele Wege zum Ziel. Im Folgenden ist ein beispielhafter ML-Workflow zu sehen. Der Workflow besteht lediglich aus Azure Produkten. Dies hat natürlich den Vorteil, dass die Konnektoren nahezu perfekt aufeinander abgestimmt sind.</p>
</div></div><div class="w-image align_center"><div class="w-image-h"><img decoding="async" width="531" height="1024" src="https://arelium.de/wp-content/uploads/2023/03/Ablauf-ML-Pipeline-531x1024.png" class="attachment-large size-large" alt="Ablauf ML Pipeline" loading="lazy" srcset="https://arelium.de/wp-content/uploads/2023/03/Ablauf-ML-Pipeline-531x1024.png 531w, https://arelium.de/wp-content/uploads/2023/03/Ablauf-ML-Pipeline-155x300.png 155w, https://arelium.de/wp-content/uploads/2023/03/Ablauf-ML-Pipeline-207x400.png 207w, https://arelium.de/wp-content/uploads/2023/03/Ablauf-ML-Pipeline.png 865w" sizes="auto, (max-width: 531px) 100vw, 531px" /></div></div><div class="w-separator size_medium"></div><div class="wpb_text_column"><div class="wpb_wrapper"><h3>Unsere Spezialisten</h3>
<p>Auch im Bereich des Machine Learning haben wir als arelium zahlreiche Kundenprojekte betreut. Darunter eine Machbarkeitsstudie zur Betrugserkennung mit dem Azure ML Studio. Hier haben wir zusammen mit dem Kunden eine auf ihr System maßgeschneiderte Lösung ausgearbeitet. Wenn wir Ihre Neugierde geweckt haben, kontaktieren Sie uns gerne. Wir helfen Ihnen zu verstehen, wie Sie die Technologie nutzen können und helfen bei der Implementierung.<br />
Mehr Informationen zu diesem Thema, finden Sie auch auf unserem <a href="https://www.youtube.com/@areliumgmbh" target="_blank" rel="noopener">YouTube-Kanal</a>.</p>
</div></div>
<p>Der Beitrag <a href="https://arelium.de/azure-machine-learning-studio/">Azure Machine Learning Studio</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/azure-machine-learning-studio/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Azure Synapse Workshop for free</title>
		<link>https://arelium.de/azure-synapse-workshop-for-free/</link>
					<comments>https://arelium.de/azure-synapse-workshop-for-free/#respond</comments>
		
		<dc:creator><![CDATA[Tobias Adler]]></dc:creator>
		<pubDate>Wed, 14 Dec 2022 09:02:14 +0000</pubDate>
				<category><![CDATA[Application Development]]></category>
		<category><![CDATA[Azure]]></category>
		<category><![CDATA[Azure Synapse]]></category>
		<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Data Lake]]></category>
		<category><![CDATA[Datenbank]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[SQL]]></category>
		<category><![CDATA[Power BI]]></category>
		<category><![CDATA[SQl]]></category>
		<guid isPermaLink="false">https://www.arelium.de/?p=8287</guid>

					<description><![CDATA[<p>Der Beitrag <a href="https://arelium.de/azure-synapse-workshop-for-free/">Azure Synapse Workshop for free</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></description>
										<content:encoded><![CDATA[<section class="l-section wpb_row height_auto"><div class="l-section-h i-cf"><div class="g-cols vc_row via_grid cols_1 laptops-cols_inherit tablets-cols_inherit mobiles-cols_1 valign_top type_default stacking_default"><div class="wpb_column vc_column_container"><div class="vc_column-inner"><div class="wpb_text_column"><div class="wpb_wrapper"><h2>Warum Azure Synapse so wichtig ist</h2>
<p>In der heutigen Zeit ist es extrem wichtig, Daten die im Arbeitsalltag entstehen, zu speichern, zu organisieren und die richtigen Schlüsse aus den gesammelten Daten zu ziehen. Bei den meisten Unternehmen  werden für unterschiedlichste Geschäftsprozesse viele verschiedene Tools und Applikationen benutzt. Azure Synapse hingegen ist ein Anwendung, mit der Sie alle Daten aus verschiedensten Quellen verarbeiten können, um sie dann zentral an einem Ort zu speichern. Und damit Sie das Meiste aus ihren Daten rausholen können, bieten wir von der arelium GmbH einen kostenlosen Workshop am Azure Marketplace an, um all Ihre Fragen zu beantworten. Somit sind auch Sie für die Zeit des Cloud-Computing gewappnet.</p>
<figure><img fetchpriority="high" decoding="async" src="../wp-content/uploads/2023/12/Modern-Data-Warehouse-MDWH-Architektur_weiss.png" sizes="(max-width: 900px) 100vw, 900px" srcset="../wp-content/uploads/2023/12/Modern-Data-Warehouse-MDWH-Architektur_weiss.png 900w, ../wp-content/uploads/2023/12/Modern-Data-Warehouse-MDWH-Architektur_weiss-300x118.png 300w, ../wp-content/uploads/2023/12/Modern-Data-Warehouse-MDWH-Architektur_weiss-768x301.png 768w" alt="Azure Synapse Modern Data Warehouse" width="900" height="353" /><figcaption>Beispielarchitektur mit Azure Synapse als zentrales Element</figcaption></figure>
<h2>Hier bleibt keine Frage offen</h2>
<p>Bei diesem Workshop können sich Interessierte eine Stunde lang mit einem unserer erfahrenen <a href="/team/">Data Engineers</a> unterhalten. Hier werden dann alle Fragen zum Thema Azure Synapse geklärt. Somit steht einer Implementierung in ihrem Unternehmen nichts mehr im Weg. In diesem Gespräch können Sie uns allgemeine Fragen zu Azure Synapse stellen und uns Ihre aktuelle Umgebung schildern. Unsere Experten werden Ihnen dann Lösungen zu Ihren Problemen liefern, Ihre aktuelle Umgebung beurteilen und Ihnen ein <a href="https://learn.microsoft.com/de-de/azure/architecture/example-scenario/data/small-medium-data-warehouse" target="_blank" rel="noopener">leistungsstarkes Konzept</a> vorschlagen, mit dem Sie Zeit und Kosten einsparen können. Bei diesem Gespräch handelt es sich also um eine Komplettlösung. Das Beste daran ist, dass dieses Erstgespräch Sie nichts kostet. Sie kriegen einen Einblick in die Welt von Azure Synapse.</p>
<h2>Wann findet der nächste Workshop statt?</h2>
<p>Da es sich bei diesem Workshop um keinen einmaligen Termin handelt, liegt das ganz bei Ihnen. Bei diesem Seminar geht es darum, Ihre Wünsche in der einstündigen Session zu erfüllen und Ihnen das Thema Synapse näher zu bringen. Wenn Sie dieses kostenfreie Angebot wahrnehmen möchten, melden Sie sich über <a href="mailto:info@arelium.de">info@arelium.de</a> zur Vereinbarung eines Termins mit einem unserer <a href="/synapse-analytics-experten/">Spezialisten.</a></p>
</div></div></div></div></div></div></section>
<p>Der Beitrag <a href="https://arelium.de/azure-synapse-workshop-for-free/">Azure Synapse Workshop for free</a> erschien zuerst auf <a href="https://arelium.de">arelium - Wir holen mehr aus deinen Daten</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://arelium.de/azure-synapse-workshop-for-free/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
