Was bedeutet Underfitting (Unteranpassung)?

Underfitting 2

Definition

Underfitting ist ein Problem in der Statistik, bei dem ein Modell zu wenig an die Trainingsdaten angepasst ist und dadurch seine Vorhersagegenauigkeit auf unbekannten Daten beeinträchtigt wird. Es tritt auf, wenn das Modell zu einfach ist und nicht in der Lage ist, die komplexen Zusammenhänge in den Daten abzubilden. Dem Modell fehlt es somit an Aussagekraft.

Welche Ursachen kann es dafür geben? 

Ursachen für Underfitting können sein:

  • Zu wenig Merkmale: Ein Modell mit zu wenig Merkmalen kann nicht in der Lage sein, die komplexen Zusammenhänge in den Daten abzubilden.
  • Zu viele Einschränkungen: Ein Modell, das zu stark eingeschränkt ist, kann nicht genug anpassen, um die Daten richtig abzubilden
  • Zu wenig Trainingsdaten: Ein Modell benötigt ausreichende Trainingsdaten, um zu lernen und die komplexen Zusammenhänge in den Daten abzubilden. 

Wie kann man Underfitting im Machine Learning vermeiden? 

 Um Underfitting zu vermeiden, gibt es verschiedene Techniken und Methoden, die angewendet werden können: 

  • Erhöhen der Anzahl der Merkmale: Ein Modell mit mehr Merkmalen kann in der Lage sein, die komplexen Zusammenhänge in den Daten besser abzubilden. 
  • Erhöhen der Anzahl der Trainingsdaten: Ein Modell benötigt ausreichende Trainingsdaten. Dadurch kann es lernen und komplexe Zusammenhänge in den Daten abbilden.
  • Verwendung von komplexeren Modellen: Verwenden von komplexeren Modellen kann dazu beitragen, die komplexen Zusammenhänge in den Daten besser abzubilden. 

Es ist wichtig zu beachten, dass keine einzige Methode das Underfitting vollständig vermeiden kann. In der Regel kombiniert man mehrere Methoden um das bestmögliche Ergebnis zu erzielen. 

Eine weitere Methode die man verwenden kann um Unterfitting zu vermeiden, ist die Verwendung von ensemble-Methoden. Ensemble-Methoden kombinieren die Vorhersagen mehrerer Modelle, um die Vorhersagegenauigkeit zu verbessern und Underfitting zu vermeiden. Diese Technik nutzt die Stärken verschiedener Modelle und kann dazu beitragen, die Schwächen eines einzelnen Modells zu kompensieren. Es kann auch die Verwendung von Bagging und Boosting Methoden helfen.

Wie mittels Machine Learning Microsoft Azure ML Studio die Daten auswerten kann, erfahren Sie in unserem Blogbeitrag.