{"id":4072,"date":"2021-02-10T08:00:38","date_gmt":"2021-02-10T08:00:38","guid":{"rendered":"https:\/\/lamarr-institute.org\/blog\/intelligenter-labeln-mit-aktivem-lernen\/"},"modified":"2025-11-12T14:52:34","modified_gmt":"2025-11-12T14:52:34","slug":"intelligenter-labeln-mit-aktivem-lernen","status":"publish","type":"blog","link":"https:\/\/lamarr-institute.org\/de\/blog\/intelligenter-labeln-mit-aktivem-lernen\/","title":{"rendered":"Intelligenter Labeln mit Aktivem Lernen"},"content":{"rendered":"\n<p>Jedes Jahr werden mehrere Zettabytes an Daten generiert. Diese rohen Daten sind f\u00fcr maschinelle Lernalgorithmen allerdings h\u00e4ufig unbrauchbar. Die Herausforderung im Maschinellen Lernen ist n\u00e4mlich nicht mehr, einen Zugriff auf Daten zu erhalten, sondern schnell gelabelte Daten mit hoher Qualit\u00e4t zu gewinnen. Nehmen wir das Beispiel Objekterkennung mittels Captcha \u2013 also einem Test, mit dem festgestellt werden kann, ob ein Mensch oder ein Computer ein Programm bedient: Wenn der Nutzer aufgefordert wird, die Bilder auszuw\u00e4hlen, auf denen Ampeln zu erkennen sind, dann wird das Label \u201eAmpel\u201c bzw. \u201ekeine Ampel\u201c f\u00fcr die Bilder vergeben, die man anklickt bzw. nicht anklickt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/captcha_example1-1-e1608277018955.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-24470\" title=\"\"><figcaption class=\"wp-element-caption\">\u00a9 Katharina Beckh &#8211; Fraunhofer IAIS<br><\/figcaption><\/figure>\n\n\n\n<p>Durch den Prozess des Markierens entstehen gelabelte Daten, anhand derer ein maschnieller Lernalgorithmus ein statistisches Modell aufbaut, um bisher ungesehene Bilder zu klassifizieren. In diesem Fall werden die Klassen \u201eAmpel\u201c und \u201ekeine Ampel\u201c zugeordnet. Siehe <a href=\"https:\/\/machinelearning-blog.de\/grundlagen\/welche-arten-von-maschinellem-lernen-gibt-es\/\" target=\"_blank\" rel=\"noreferrer noopener\">&#8222;Welche Arten von Maschinellem Lernen gibt es?&#8220;<\/a> f\u00fcr mehr Informationen \u00fcber Klassifikation.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Herausforderung: Manche Label k\u00f6nnen nur von Experten vergeben werden<\/h2>\n\n\n\n<p>Im Bezug auf Objekterkennung k\u00f6nnen wir uns vorstellen, dass wir auch Stopp-Schilder, Kinder oder Schlagl\u00f6cher erkennen wollen. Label k\u00f6nnen somit beliebig vielseitig verwendet werden.<br>Je nach Art der Klassifikationsaufgabe, kann der Label-Prozess ebenfalls kompliziert sein. F\u00fcr die Identifikation einer Ampel reicht grundlegendes Wissen aus. Schwieriger ist es bei Klassifikationsaufgaben, die komplexes Hintergrundwissen ben\u00f6tigen: z.B. anhand eines Ultraschallbilds festzustellen, ob ein Tumor vorliegt oder nicht. Diese Aufgabe erfordert Expertenwissen. Der Label-Prozess ist in solchen F\u00e4llen erschwert, weil nur wenige Personen \u00fcberhaupt f\u00fcr das Labeln infrage kommen. Da \u00fcblicherweise gro\u00dfe Mengen an Daten notwendig sind, ist das Labeln entsprechend m\u00fchsam und zeitaufw\u00e4ndig.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Aktives Lernen entlastet Annotatoren<\/h2>\n\n\n\n<p>Eine M\u00f6glichkeit, den Aufwand zu reduzieren, ist der Einsatz von Aktivem Lernen, das eine Unterkategorie des \u00fcberwachten Lernens darstellt. Aktives Lernen bezeichnet einen Lernalgorithmus, der Datenpunkte aus einer Menge an noch nicht gelabelten Datenpunkten gezielt ausw\u00e4hlt, um sie als n\u00e4chstes labeln zu lassen. Die Vergabe von Labels kann unter anderem von einem Menschen oder zu Evaluierungszwecken vom Algorithmus erfolgen. Die Auswahl der Datenpunkte erfolgt nach einer Selektionsstrategie. Eine h\u00e4ufig gew\u00e4hlte Selektionsstrategie ist Uncertainty Sampling, das den Datenpunkt mit der geringsten Konfidenz ausw\u00e4hlt. Die geringste Konfidenz bedeutet hierbei, dass der Algorithmus bei diesem Datenpunkt am wenigsten sicher ist, zu welcher Klasse dieser passt. Der Grundgedanke ist, dass das Modell mit weniger Datenpunkten eine genauso hohe oder h\u00f6here Klassifikationsgenauigkeit (z.B. 90% richtig erkannt) erzielt wie ein Modell, das alle Datenpunkte nutzt. Wann der Lernprozess stoppt, wird \u00fcber ein Stoppkriterium definiert.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"504\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/AL_cycle1-1-e1608221708569_EN.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-12866\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/AL_cycle1-1-e1608221708569_EN.png 800w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/AL_cycle1-1-e1608221708569_EN-300x189.png 300w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/AL_cycle1-1-e1608221708569_EN-768x484.png 768w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><figcaption class=\"wp-element-caption\">\u00a9 Katharina Beckh &#8211; Fraunhofer IAIS<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Der Prozess im Detail<\/h2>\n\n\n\n<p>Im Folgenden beschreiben wir den Ablauf des Aktiven Lernens anhand der Objekterkennung und mit Uncertainty Sampling als Selektionsstrategie. Am Anfang haben wir eine Menge an Bilddaten gegeben und eine Person, die diese labeln soll.<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Ein kleiner Teil der Daten wird gelabelt, um sicherzustellen, dass wir sowohl Beispiele f\u00fcr Bilder mit Ampeln, als auch Bilder ohne Ampeln haben.<\/li>\n\n\n\n<li>Das Modell wird trainiert.<\/li>\n\n\n\n<li>Das Modell gibt eine Vorhersage \u00fcber die Klasse aller ungelabelten Bilder.<\/li>\n\n\n\n<li>Das Bild mit dem geringsten Wert, d.h. mit der gr\u00f6\u00dften Unsicherheit, wird ausgew\u00e4hlt und der Person angezeigt, damit sie es labeln kann.<\/li>\n\n\n\n<li>Die Person gibt an, ob eine Ampel auf dem Bild zu sehen ist oder nicht und die Information wird gespeichert.<\/li>\n\n\n\n<li>Wenn das Stoppkriterium noch nicht erreicht ist, springt der Prozess wieder zu 2 (Modell Training).<\/li>\n<\/ol>\n\n\n\n<p>Es ist m\u00f6glich, dem Menschen in Schritt 4 direkt mehrere Bilder zur Verf\u00fcgung zu stellen. Der Vorteil zeigt sich darin, dass nicht nach jedem Bild neu trainiert werden muss, was je nach Modellkomplexit\u00e4t viel Zeit in Anspruch nimmt. Die Anzahl an Datenpunkten, die ein Mensch kognitiv noch gut verarbeiten kann, liegt bei zehn. Deshalb ist beispielsweise die Anzahl der Links bei einer Google Suche auf zehn pro Seite begrenzt. Wie man das Stoppkriterium definiert, h\u00e4ngt stark vom Anwendungsfall ab und wird auch durch die zur Verf\u00fcgung stehenden Ressourcen bedingt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Einsatzszenario: Aktives Lernen beim autonomen Fahren<\/h2>\n\n\n\n<p>Ein gro\u00dfer Player in der Datengenerierung ist die Automobilbranche. Es wird grob davon ausgegangen, dass die Sensoren in einem autonomen Fahrzeug am Tag mindestens 5 Terabytes an Daten produzieren. Diese Mengen an Daten zu labeln ist nahezu unm\u00f6glich. Genau aus diesem Grund kommt Aktives Lernen ins Spiel. In diesem Fall w\u00e4hlt der Algorithmus Videobilder aus, die schwer zu klassifizieren sind, weil die Bilder zum Beispiel Objekte enthalten, die bisher ungesehen sind. Ein Team des Graphikprozessoren- und Chipentwicklers <a href=\"https:\/\/medium.com\/nvidia-ai\/scalable-active-learning-for-autonomous-driving-a-practical-implementation-and-a-b-test-4d315ed04b5f\" target=\"_blank\" rel=\"noreferrer noopener\">Nvidia<\/a> hat festgestellt, dass bei der Erkennung von Fu\u00dfg\u00e4nger*innen und Fahrr\u00e4dern die Genauigkeit mit Aktivem Lernen h\u00f6her ist als bei einer Auswahl durch Menschen.<\/p>\n\n\n\n<p>Aktives Lernen ist interessant, wenn (1) viele ungelabelte Daten vorliegen und Label zu gewinnen teuer und zeitaufw\u00e4ndig ist und (2) bei der manuellen Datenauswahl ein Selektionsbias zu erwarten ist. Ein Selektionsbias zeigte sich zum Beispiel in der Studie von Nvidia: Menschen w\u00e4hlten typischerweise nur Aufnahmen aus einer einzigen Fahrsession aus, w\u00e4hrend der Aktive Lernalgorithmus Bilder aus ganz vielen verschiedenen Fahrsessions ausw\u00e4hlte. Aktives Lernen wird bisher in der Praxis noch wenig genutzt, gewinnt aber durch aktuelle Entwicklungen an Relevanz. Speziell im Hinblick auf den Bedarf an vertrauensw\u00fcrdiger KI wird der Ansatz an Bedeutung gewinnen, da Aktives Lernen es erm\u00f6glicht, einen Menschen in den Lernprozess zu involvieren.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mit Aktivem Lernen wird das Annotieren von Daten schneller und kosteng\u00fcnstiger. Die Methode bindet Menschen effizient in den Prozess des Maschinellen Lernens ein und bildet damit ein Sprungbrett f\u00fcr vertrauensw\u00fcrdige KI.<\/p>\n","protected":false},"author":9,"featured_media":4077,"template":"","meta":{"_acf_changed":false,"footnotes":""},"blog-category":[1416,390],"blog-tag":[1443,1533,1550,1593],"class_list":["post-4072","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-alle-blogbeitraege","blog-category-grundlagen","blog-tag-aktives-lernen","blog-tag-klassifikation","blog-tag-labeling-de","blog-tag-sichere-ki"],"acf":[],"publishpress_future_workflow_manual_trigger":{"enabledWorkflows":[]},"_links":{"self":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4072","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/types\/blog"}],"author":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/users\/9"}],"version-history":[{"count":0,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4072\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media\/4077"}],"wp:attachment":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media?parent=4072"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-category?post=4072"},{"taxonomy":"blog-tag","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-tag?post=4072"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}