Was Mücken und physikalische Daten verbindet

Internationale Forschungsgruppe mit Mirko Bunse und André Maletzke an der Unioeste in Brasilien während eines wissenschaftlichen Austauschs.
Forschungsgruppe um André Maletzke und Mirko Bunse während des Austauschs an der Universidade Estadual do Oeste do Paraná (Unioeste) in Brasilien.

Foz do Iguaçu, Brasilien. Was verbindet die Ausbreitung von Mückenpopulationen mit der Analyse physikalischer Messdaten? Mehr, als es auf den ersten Blick scheint: In beiden Fällen steht die Forschung vor derselben Herausforderung, zuverlässige Aussagen über Häufigkeiten zu treffen, obwohl sich die zugrunde liegenden Daten verändern. Genau daran arbeitet Dr. Mirko Bunse, Research Associate am Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz und KI-Forscher an der TU Dortmund, während eines Forschungsaufenthalts in Brasilien. Gemeinsam mit Dr. André Maletzke von der Universidade Estadual do Oeste do Paraná (Unioeste) entwickelt er Verfahren, die solche Verschiebungen systematisch berücksichtigen.

Ein gemeinsames Problem über Disziplinen hinweg

Im Zentrum steht die Schätzung der sogenannten Klassenhäufigkeiten (Class Prevalence), also der Häufigkeit von Klassen innerhalb eines Datensatzes. Anders als bei klassischen Klassifikationsaufgaben zielt sie nicht auf die korrekte Zuordnung einzelner Objekte, sondern auf die präzise Bestimmung ihrer relativen Häufigkeiten. Diese Perspektive ist in unterschiedlichen Kontexten entscheidend: In Brasilien dienen intelligente Mückenfallen dazu, Populationen bestimmter Arten zu quantifizieren, eine Grundlage für Maßnahmen im öffentlichen Gesundheitswesen. In der Physik stellt sich dieselbe Frage bei der Auswertung experimenteller Daten, etwa bei der Bestimmung von Teilchentypen oder bei Daten aus Neutrinoteleskopen, bei denen es ebenfalls um die relativen Häufigkeiten unterschiedlicher Klassen geht.

Das Problem liegt in der Verschiebung der Datenverteilungen: Modelle werden unter bestimmten Bedingungen trainiert und treffen in der Anwendung auf veränderte Daten. Ohne geeignete Anpassung führt das zu systematischen Verzerrungen. Die gemeinsame Forschung setzt genau hier an und entwickelt Methoden, die diese Verschiebungen modellieren und in die Schätzung integrieren.

Interdisziplinärer Methodenvergleich als Forschungsansatz

Der Aufenthalt führt unterschiedliche wissenschaftliche Perspektiven auf ein gemeinsames methodisches Problem zusammen. Während die brasilianische Arbeitsgruppe ihre Ansätze in ökologischen und gesundheitsbezogenen Anwendungen entwickelt, bringt Bunse Erfahrungen aus physikalischen Analysen ein. Daraus entstehen gemeinsame methodische Ansätze, die sich über Disziplingrenzen hinweg weiterentwickeln lassen. „Wir arbeiten mit sehr unterschiedlichen Daten, von Mückenpopulationen bis zu physikalischen Messreihen. Aber die zugrunde liegende Frage ist dieselbe: Wie lassen sich Häufigkeiten auch dann zuverlässig bestimmen, wenn sich die Daten verändern? Der Austausch hilft uns, Methoden zu entwickeln, die genau gegen solche Veränderungen robuster sind“, sagt Bunse. Für das Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz ist diese Form der Zusammenarbeit exemplarisch. Sie macht sichtbar, dass zentrale Herausforderungen des Maschinellen Lernens nicht an einzelne Anwendungsfelder gebunden sind. So entstehen Verfahren, die auch unter veränderten Bedingungen stabil und übertragbar sind.

Weitere News