Nachdem wir in unserem ersten Beitrag aus der „ML Basics“ Reihe darauf eingegangen sind, wie Maschinen lernen, betrachten wir in diesem Beitrag der Reihe die Arten von Maschinellem Lernen. Dabei legt ein Paradigma fest, wie ein Algorithmus lernt. Wir schauen uns Paradigmen an, betrachten jedoch keine konkreten Algorithmen für das Lernen. Welches Paradigma eingesetzt wird, hängt von der Aufgabenstellung und der Art der Daten ab. Damit ein Paradigma genutzt werden kann, muss es als Verfahren implementiert werden. In diesem Blogebeitrag stellen wir fünf Arten von Maschinellem Lernen vor: unüberwachtes, überwachtes, semi-überwachtes, aktives und reinforcement Lernen.
Unüberwacht (unsupervised Learning): Beim unüberwachten Lernen gibt es keinerlei Feedback an den Algorithmus während des Lernens. Der Algorithmus versucht in diesem Fall, inhärente Strukturen in den Daten zu erkennen und daraus zu lernen. Zu den unüberwachten Lernmethoden gehören alle ähnlichkeitsbasierten Verfahren, wie zum Beispiel die Clusteranalyse, welche ähnliche Objekte zu Gruppen zusammenfassen, oder einige Verfahren der Dimensionsreduktion. Ein alltägliches Beispiel einer Dimensionsreduktion ist ein Schatten. Er liefert eine zweidimensionale Abbildung eines dreidimensionalen Gegenstandes. Stellen wir uns Daten als hochdimensionale Objekte vor, so können wir auch diese in niedrigere Dimensionen projizieren und so die Komplexität reduzieren.
Überwacht (supervised Learning): Überwachtes Lernen zeichnet sich dadurch aus, dass zu jedem Trainingsbeispiel ein aktives Feedback möglich ist. Das Feedback holt sich ein Algorithmus selbständig aus den Trainingsdaten. Dies setzt voraus, dass die Trainingsdaten so beschaffen sind, dass zu jedem Datenpunkt die richtige Antwort bekannt ist. Ein klassisches Beispiel für überwachtes Lernen ist das Trainieren von von Klassifikations- oder Regressionsmodellen. Diese Modelle sind weit verbreitet und sehr universell einsetzbar. Viele Fragen lassen sich als Wahr-Falsch-Fragen formulieren, z.B. ob ein Kunde kündigen wird. Alle Fragen mit einer festen Anzahl an Antworten lassen sich als Klassifikationsproblem formulieren. Lässt sich eine Aufgabe als Vorhersage einer Zahl formulieren, wie etwa die Vorhersage einer Temperatur, so werden Regressionsmodelle eingesetzt.
Semi-überwacht (semi-supervised Learning): Im Semi-überwachten Lernen gibt es zu einigen Beispielen das Feedback wie im überwachten Lernen, zu einigen nicht. Dies ist beispielsweise häufig der Fall, wenn es darum geht, Betrug zu identifizieren. Für alle entdeckten Betrugsfälle ist bekannt, dass es sich um Betrug handelt. Für alle übrigen Daten ist die Wahrscheinlichkeit, dass es sich um Betrug handelt, gering. Es werden sich sehr wahrscheinlich jedoch noch unentdeckte Betrugsfälle in den Daten verbergen.
Reinforcement Learning: Das reinforcement Learning, zu Deutsch auch bestärkendes Lernen, unterscheidet sich von den vorhergehenden Lernformen dadurch, dass nicht zu jedem Datenpunkt ein Feedback existiert, sondern es ein Feedback häufig erst nach vielen Schritten gibt. Dies ist eine klassische Situation in vielen Spielen, bei denen es für das Gewinnen eines Spiels ein positives und für das Verlieren ein negatives Feedback gibt. Das Feedback steht in diesen Fällen erst am Ende des Spiels zur Verfügung. Es wird dann auf alle durchgeführten Züge rückgerechnet. Für das Lernen einer guten Strategie muss ein Spiel mehrfach gespielt werden.
Aktiv (active Learning): In einigen Anwendungsfällen ist es unmöglich oder sehr teuer, die richtigen Antworten für alle Datenpunkte zu beziehen. Ein klassisches Beispiel sind Empfehlungssysteme. Kein Kunde ist willig, tausende von Filmen zu bewerten, um für sich passende Vorschläge zu erhalten. Daher funktionieren Empfehlungssysteme anders: Mit jedem Vorschlag, den das System macht und aus dem der Kunde einen Film auswählt, erhält das System ein Feedback über die Präferenzen des Kunden. Indem das System aktiv auswählt, welche Vorschläge ein potenzieller Kunde angezeigt bekommt, entscheidet es auch aktiv. Mehr Informationen zum Aktivem Lernen gibt es in unserem Blogbeitrag „Intelligenter Labeln mit Aktivem Lernen“.
Die Plattform Lernende Systeme erklärt anschaulich in ihrer YouTube-Reihe „So lernen Maschinen“ die einzelnen Arten des Maschinellen Lernens. Schaut dort für weitere Informationen vorbei!