Intelligenter Labeln mit Aktivem Lernen

Aktives Lernen anhand des Captcha Beispiels|Aktives Lernen|Prozess Aktives Lernen|Prozess Aktives Lernen|Captcha Beispiel für Aktives Lernen|Aktives Lernen||
||

Jedes Jahr werden mehrere Zettabytes an Daten generiert. Diese rohen Daten sind für maschinelle Lernalgorithmen allerdings häufig unbrauchbar. Die Herausforderung im Maschinellen Lernen ist nämlich nicht mehr, einen Zugriff auf Daten zu erhalten, sondern schnell gelabelte Daten mit hoher Qualität zu gewinnen. Nehmen wir das Beispiel Objekterkennung mittels Captcha – also einem Test, mit dem festgestellt werden kann, ob ein Mensch oder ein Computer ein Programm bedient: Wenn der Nutzer aufgefordert wird, die Bilder auszuwählen, auf denen Ampeln zu erkennen sind, dann wird das Label „Ampel“ bzw. „keine Ampel“ für die Bilder vergeben, die man anklickt bzw. nicht anklickt.

captcha example1 1 e1608277018955 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Katharina Beckh – Fraunhofer IAIS

Durch den Prozess des Markierens entstehen gelabelte Daten, anhand derer ein maschnieller Lernalgorithmus ein statistisches Modell aufbaut, um bisher ungesehene Bilder zu klassifizieren. In diesem Fall werden die Klassen „Ampel“ und „keine Ampel“ zugeordnet. Siehe „Welche Arten von Maschinellem Lernen gibt es?“ für mehr Informationen über Klassifikation.

Herausforderung: Manche Label können nur von Experten vergeben werden

Im Bezug auf Objekterkennung können wir uns vorstellen, dass wir auch Stopp-Schilder, Kinder oder Schlaglöcher erkennen wollen. Label können somit beliebig vielseitig verwendet werden.
Je nach Art der Klassifikationsaufgabe, kann der Label-Prozess ebenfalls kompliziert sein. Für die Identifikation einer Ampel reicht grundlegendes Wissen aus. Schwieriger ist es bei Klassifikationsaufgaben, die komplexes Hintergrundwissen benötigen: z.B. anhand eines Ultraschallbilds festzustellen, ob ein Tumor vorliegt oder nicht. Diese Aufgabe erfordert Expertenwissen. Der Label-Prozess ist in solchen Fällen erschwert, weil nur wenige Personen überhaupt für das Labeln infrage kommen. Da üblicherweise große Mengen an Daten notwendig sind, ist das Labeln entsprechend mühsam und zeitaufwändig.

Aktives Lernen entlastet Annotatoren

Eine Möglichkeit, den Aufwand zu reduzieren, ist der Einsatz von Aktivem Lernen, das eine Unterkategorie des überwachten Lernens darstellt. Aktives Lernen bezeichnet einen Lernalgorithmus, der Datenpunkte aus einer Menge an noch nicht gelabelten Datenpunkten gezielt auswählt, um sie als nächstes labeln zu lassen. Die Vergabe von Labels kann unter anderem von einem Menschen oder zu Evaluierungszwecken vom Algorithmus erfolgen. Die Auswahl der Datenpunkte erfolgt nach einer Selektionsstrategie. Eine häufig gewählte Selektionsstrategie ist Uncertainty Sampling, das den Datenpunkt mit der geringsten Konfidenz auswählt. Die geringste Konfidenz bedeutet hierbei, dass der Algorithmus bei diesem Datenpunkt am wenigsten sicher ist, zu welcher Klasse dieser passt. Der Grundgedanke ist, dass das Modell mit weniger Datenpunkten eine genauso hohe oder höhere Klassifikationsgenauigkeit (z.B. 90% richtig erkannt) erzielt wie ein Modell, das alle Datenpunkte nutzt. Wann der Lernprozess stoppt, wird über ein Stoppkriterium definiert.

AL cycle1 1 e1608221708569 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Katharina Beckh – Fraunhofer IAIS

Der Prozess im Detail

Im Folgenden beschreiben wir den Ablauf des Aktiven Lernens anhand der Objekterkennung und mit Uncertainty Sampling als Selektionsstrategie. Am Anfang haben wir eine Menge an Bilddaten gegeben und eine Person, die diese labeln soll.

  1. Ein kleiner Teil der Daten wird gelabelt, um sicherzustellen, dass wir sowohl Beispiele für Bilder mit Ampeln, als auch Bilder ohne Ampeln haben.
  2. Das Modell wird trainiert.
  3. Das Modell gibt eine Vorhersage über die Klasse aller ungelabelten Bilder.
  4. Das Bild mit dem geringsten Wert, d.h. mit der größten Unsicherheit, wird ausgewählt und der Person angezeigt, damit sie es labeln kann.
  5. Die Person gibt an, ob eine Ampel auf dem Bild zu sehen ist oder nicht und die Information wird gespeichert.
  6. Wenn das Stoppkriterium noch nicht erreicht ist, springt der Prozess wieder zu 2 (Modell Training).

Es ist möglich, dem Menschen in Schritt 4 direkt mehrere Bilder zur Verfügung zu stellen. Der Vorteil zeigt sich darin, dass nicht nach jedem Bild neu trainiert werden muss, was je nach Modellkomplexität viel Zeit in Anspruch nimmt. Die Anzahl an Datenpunkten, die ein Mensch kognitiv noch gut verarbeiten kann, liegt bei zehn. Deshalb ist beispielsweise die Anzahl der Links bei einer Google Suche auf zehn pro Seite begrenzt. Wie man das Stoppkriterium definiert, hängt stark vom Anwendungsfall ab und wird auch durch die zur Verfügung stehenden Ressourcen bedingt.

Einsatzszenario: Aktives Lernen beim autonomen Fahren

Ein großer Player in der Datengenerierung ist die Automobilbranche. Es wird grob davon ausgegangen, dass die Sensoren in einem autonomen Fahrzeug am Tag mindestens 5 Terabytes an Daten produzieren. Diese Mengen an Daten zu labeln ist nahezu unmöglich. Genau aus diesem Grund kommt Aktives Lernen ins Spiel. In diesem Fall wählt der Algorithmus Videobilder aus, die schwer zu klassifizieren sind, weil die Bilder zum Beispiel Objekte enthalten, die bisher ungesehen sind. Ein Team des Graphikprozessoren- und Chipentwicklers Nvidia hat festgestellt, dass bei der Erkennung von Fußgänger*innen und Fahrrädern die Genauigkeit mit Aktivem Lernen höher ist als bei einer Auswahl durch Menschen.

Aktives Lernen ist interessant, wenn (1) viele ungelabelte Daten vorliegen und Label zu gewinnen teuer und zeitaufwändig ist und (2) bei der manuellen Datenauswahl ein Selektionsbias zu erwarten ist. Ein Selektionsbias zeigte sich zum Beispiel in der Studie von Nvidia: Menschen wählten typischerweise nur Aufnahmen aus einer einzigen Fahrsession aus, während der Aktive Lernalgorithmus Bilder aus ganz vielen verschiedenen Fahrsessions auswählte. Aktives Lernen wird bisher in der Praxis noch wenig genutzt, gewinnt aber durch aktuelle Entwicklungen an Relevanz. Speziell im Hinblick auf den Bedarf an vertrauenswürdiger KI wird der Ansatz an Bedeutung gewinnen, da Aktives Lernen es ermöglicht, einen Menschen in den Lernprozess zu involvieren.

Katharina Beckh,

10. Februar 2021

Themen

Katharina Beckh

Katharina Beckh ist wissenschaftliche Mitarbeiterin am Lamarr-Standort des Fraunhofer IAIS. Ihr Forschungsschwerpunkt liegt auf dem menschenorientierten Maschinellen Lernen. Sie beschäftigt sich mit interaktiven Lernalgorithmen und erklärbaren Sprachmodellen.

Weitere Blogartikel