Zum Inhalt springen
Startseite » Was ist Überwachtes Lernen (Supervised Learning)?

Was ist Überwachtes Lernen (Supervised Learning)?

Überwachtes Lernen (Supervised Learning) ist ein Ansatz im Bereich des maschinellen Lernens, bei dem ein Modell auf der Basis von gekennzeichneten (gelabelten) Trainingsdaten trainiert wird. Das bedeutet, dass die Eingabedaten (Features) zusammen mit den entsprechenden Zielwerten (Labels) bereitgestellt werden. Beim überwachten Lernen werden also dem Modell Eingabedaten und die entsprechenden richtigen Ausgaben präsentiert. Ziel ist es, eine Funktion oder ein Modell zu erstellen, das basierend auf den Eingabedaten die Zielwerte möglichst genau vorhersagen kann.

Beispiel

Stellen Sie sich vor, man möchte einem Computer beibringen, Äpfel von Birnen zu unterscheiden:

  1. Trainingsdaten: Sie geben dem Computer viele Bilder von Obst, wobei jedes Bild bereits korrekt gekennzeichnet ist („Das ist ein Apfel“, „Das ist eine Birne“). Das sind die Eingabedaten (X) mit den dazugehörigen „richtigen Antworten“ oder Labels (Y).
  2. Lernprozess: Der Algorithmus analysiert die Merkmale der Bilder (z.B. Form der Frucht, Blätter usw.), erkennt Muster in den Daten und passt seine Parameter an, um möglichst genaue Vorhersagen zu treffen.

Vereinfachte Darstellung der Lernergebnisse

Nach dem Training enthält das Modell Parameter, die es ermöglichen, neue Eingaben zu analysieren und Vorhersagen zu treffen. Sie können in einfachen Modellen als Vektoren/Matrizen und in komplexeren Modellen als hierarchische Strukturen (z. B. für neuronale Netze) gespeichert werden. Eine vereinfachte Speicherung der Lernergebnisse könnte wie folgt aussehen.

# Als Python-Array dargestellt
weights = [[0.4, -0.5], ...]  # Matrix
biases = [0.1, 0.2]  # Vektor
Zwei Eingabeknoten und ein Neuron darüber, das zwei eingehende Pfeile von den Eingabeknoten hat. Der Bias-Wert (auf Deutsch oft als „Schwellwert“ bezeichnet) ist eine Konstante, die zu der gewichteten Summe der Eingaben eines Neurons addiert wird, bevor die Aktivierungsfunktion angewendet wird.

Anwendungsfälle

  • Spam-Erkennung in E-Mails
  • Gesichtserkennung
  • Krankheitsdiagnose anhand von medizinischen Daten
  • Vorhersage von Immobilienpreisen

Der wesentliche Unterschied zum unüberwachten Lernen besteht darin, dass beim überwachten Lernen die korrekten Antworten während des Trainings bekannt sind – wie ein Lehrer, der einem Schüler sagt, ob seine Antworten richtig oder falsch sind.