Wie kann Maschinelles Lernen bei der Bekämpfung von Corona helfen?

|Visualisierung und Analyse des Infektionsgeschehens unterstützen die Kontaktnachverfolgung|Geografischer Unterschied in der Verbreitung in drei zeitlichen Phasen|Visulisierungen zu den Infektionsgeschehen zwischen Altersgruppen|||
© CDC/Unsplash

Die aktuelle Corona-Pandemie stellt die Gesundheitsämter in Deutschland vor neue Herausforderungen. Innerhalb kürzester Zeit mussten die personellen und technischen Voraussetzungen geschaffen werden, um auf die dynamischen Entwicklungen zu reagieren. Eine Hauptaufgabe besteht dabei in der Nachverfolgung von Infektionsketten und der anschließenden Anordnung von Isolation beziehungsweise Quarantäne. Um diese Aufgabe zu bewältigen, erfassen Gesundheitsämter verschiedene Informationen von positiv getesteten Personen und deren Kontaktpersonen – darunter demografische und epidemiologische Daten.

2020 12 09 Merge scaled 2 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Fraunhofer IAIS, Dario Antweiler
Die Visualisierung und Analyse des Infektionsgeschehens unterstützen die Kontaktnachverfolgung. Das Bild zeigt ein fiktives Beispiel von infizierten Personen (rote Quadrate beziehungsweise Punkte) und den zugehörigen bekannten Ansteckungen zwischen ihnen (Pfeile).

Im Sommer 2020 startete im Rahmen der Initiative »Fraunhofer vs. Corona« eine Kooperation bestehend aus jeweils sechs deutschen Gesundheitsämtern und Fraunhofer-Instituten. Das Projekt »CorASiV« (»Unterstützung der Gesundheitsämter in der Corona-Response durch Analyse, Simulation und Visualisierung«) hat zum Ziel, die verfügbaren Daten des Infektionsgeschehens zu analysieren, aufzubereiten und dadurch die Gesundheitsexpert*innen bei der Kontaktverfolgung zu unterstützen. Eingesetzt werden dafür Techniken des Maschinellen Lernens, der Datenvisualisierung und der mathematischen Simulation. Data Scientists am Fraunhofer IAIS arbeiten innerhalb des Projektes eng mit dem Gesundheitsamt Köln zusammen, welches als größtes deutsches Gesundheitsamt für mehr als eine Millionen Menschen zuständig ist. Die Projektschwerpunkte des Fraunhofer IAIS liegen dabei auf der Analyseunterstützung von strukturierten sowie raumzeitlichen Daten im Hinblick auf die Eindämmung der Pandemie.

Muster in der Infektionsausbreitung erkennen

Gemeinsam mit dem Gesundheitsamt wurden zunächst Analyse-Fragestellungen definiert, die in der aktuellen Situation besonders wichtig sind. Dazu zählt beispielsweise die Identifikation von »Infektionsclustern«, das heißt von mehreren Personen, die sich vermutlich an einer gemeinsamen Quelle infiziert haben. Eine weitere Aufgabenstellung ist die Erforschung der geografischen Ausbreitung des neuartigen Virus in der Stadt: Mit welcher Geschwindigkeit und in welchen Stadtbezirken erfolgt die Ausbreitung?

Die aktuellen Analysen der Fraunhofer-Wissenschaftler*innen in Zusammenarbeit mit dem Gesundheitsamt zeigen altersspezifische, geografische und damit auch eingeschränkt sozio-ökonomische Zusammenhänge in der Verbreitung von Covid-19 in Köln auf. Allerdings zeigen sie auch, dass diese Zusammenhänge allein keine kausalen Rückschlüsse auf die Ursachen dieser Ausbrüche oder der Infektionsverläufe zulassen. Die Analysen unterstützen das Gesundheitsamt Köln dabei, konkrete Maßnahmen wie zum Beispiel in der Kommunikation der AHA-Regeln oder auch die Platzierung der Standorte für Schnell- und Selbsttests strategisch auszubauen.

Bei der Analyse wurde der Infektionsverlauf in drei zeitliche Phasen unterteilt und jeweils individuell betrachtet wie auch miteinander verglichen: Die Phase 1 von März 2020 bis Juni 2020, Phase 2 von Juli 2020 bis November 2020 und Phase 3 von Dezember 2020 bis Januar 2021. Es zeigt sich ein klarer geografischer Unterschied in der Verbreitung. Während sich in Phase 1 das Infektionsgeschehen primär in linksrheinischen Stadtteilen ausbreitete, trat es in Phase 2 und 3 überwiegend im rechtsrheinischen Stadtgebiet auf.

Bei den Infektionsgeschehen zwischen Altersgruppen bezieht sich die Analyse auf die Fälle, in denen die bekannte Ansteckungsquelle in Köln liegt, was in etwa 30 Prozent der Fälle passiert. Es finden sich drei Übertragungsmuster:

  • Die meisten Ansteckungen passieren innerhalb der gleichen Altersgeneration
  • Außerhalb der eigenen Generation steckt man sich häufiger bei älteren Personen an​. Nur 14 Prozent stecken sich bei jüngeren Menschen an. Dieses Szenario umfasst sowohl Infektionswege von jungen Kindern auf ihre Eltern als auch die erwachsenen Menschen auf die Großelterngeneration.
  • Darüber hinaus zeigt sich, dass 72 Prozent der Indexpersonen, die sich bei einer jüngeren Person angesteckt haben, das Virus nicht weitergeben. Hier werden Infektionsketten also erfolgreich unterbrochen.
corasiv altersgruppen 1 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Fraunhofer IAIS
Visulisierungen zu den Infektionsgeschehen zwischen Altersgruppen

Neben den Kontaktnachverfolgungsdaten liegen auch Datenquellen über die sozio-ökonomischen Faktoren der jeweiligen Stadtteile vor, wie zum Beispiel Arbeitslosenquote, Mietspiegel und Migrationsanteil. Diese Daten wurden zur weiteren Betrachtung des geografischen Verlaufs der 7-Tage Inzidenz hinzugezogen. Anzumerken ist, dass keine tatsächlichen Daten über die sozio-ökonomischen Faktoren der individuellen Indexpersonen vorliegen, da keine der oben genannten Faktoren in der Kontaktnachverfolgung erhoben werden. Bei den Analysen haben sich folgende Beobachtungen ergeben:

  • Stadtteile mit niedriger Arbeitslosigkeit waren in der frühen Phase stärker betroffen.
  • Stadtteile mit hoher Arbeitslosigkeit waren in den späteren Phasen stärker betroffen. Migrationsanteil und Mietspiegel verhalten sich ähnlich.
  • Für Indexpersonen in Stadtteilen mit hoher Arbeitslosigkeit ist Ansteckungsquelle öfter bekannt​.
corasiv inzidenzverlauf 1 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Fraunhofer IAIS
Geografischer Unterschied in der Verbreitung in drei zeitlichen Phasen

Infektionsfälle analysieren und visualisieren

Um die Zusammenhänge verschiedener Infektionsfälle besser nachvollziehen zu können, spielt die Visualisierung der Kontaktverfolgungsdaten eine wichtige Rolle. Im Rahmen des Projektes wurden dazu unterschiedliche Herangehensweisen erprobt, die den jeweiligen Fokus auf die zeitliche Entwicklung, geografische Verteilung oder Merkmale der infizierten Personen setzen und diese Daten in ein Verhältnis zueinander setzen. Je nach Fragestellung der Gesundheitsexpert*innen kann dadurch eine flexible und interaktive Darstellung der Informationen erreicht werden. Beispielweise sollen die oben beschriebenen Visualisierungen der Infektionsdaten helfen die Ausbreitung über längere Infektionsketten besser zu verstehen.

Die Ergebnisse der Untersuchungen von Kontaktnachverfolgungsdaten der Stadt Köln wurden auf einer gemeinsamen Pressekonferenz mit der Stadt durch ML2R Transfer Manager und IAIS Abteilungsleiter Stefan Rüping vorgestellt (mehr unter welt.de ab Minute 07:40). Die aktuellen Ergebnisse sind auf der Projektwebseite zu finden (für Rückfragen wenden Sie sich bitte über die Projektseite an Sebastian Ginzel).

Eine der Methoden für die Modellierung durch maschinelle Lernverfahren wurde zusammen mit dem ML2R-Forschenden Pascal Welke sowie Dario Antweiler vom Fraunhofer IAIS als Workshop-Paper auf der wichtigsten Fachkonferenz für Künstliche Intelligenz (NeurIPS 2020) publiziert. Zentrale Fragestellung war hier, wie das Netzwerk, welches durch positiv-getestete Personen und vermutete Übertragungen entsteht, effektiv analysiert werden kann. In der Publikation wird ein Ansatz vorgestellt, der eine interaktive Bestimmung einander ähnlicher Komponenten ermöglicht. Auf solchen Workshops stellen Expert*innen neue Ansätze vor, die mathematische oder technische Herausforderungen lösen sollen. Diese Veranstaltungen stehen zu Beginn eines wissenschaftlichen Prozesses, bei dem neue Methoden für Forschungsfelder, wie den Einsatz von maschinellem Lernen für das öffentliche Gesundheitswesen entwickelt werden.

Künstliche Intelligenz im Gesundheitswesen

Nachdem Methoden der Künstlichen Intelligenz bereits in verschiedenen Bereichen der Medizin Fuß gefasst haben, wird immer deutlicher, wie die eng verwandten Bereiche des öffentlichen Gesundheitswesens und der Pharmakologie von diesen neuen Technologien profitieren können. Gemeinsame Kooperationsprojekte mit engem Austausch zwischen Domänen-Expert*innen und Data Scientists eignen sich dafür besonders. Dabei bieten neue Ansätze basierend auf Künstlicher Intelligenz zwar mächtige Potentiale, doch die Definition der richtigen Fragestellung sowie eine sinnvolle Interpretierung der Ergebnisse sind die Grundlage für erfolgreiche Anwendungen von Maschinellem Lernen in der Praxis. Mehr dazu in unserem Blogbeitrag „Künstliche Intelligenz im Krankenhaus“.

Das Fraunhofer IAIS setzt in vielfältigen Projekten und Initiativen Methoden der Künstlichen Intelligenz im Rahmen der Pandemie-Bekämpfung ein. Ein weiteres aktuelles Projekt stellt beispielsweise »COPERIMOplus« dar. In diesem Projekt liegt der Fokus auf der Erstellung personalisierter Risikoprofile durch den Einsatz maschineller Lernverfahren für die prädiktive Analyse klinischer Daten und Biomarkern.

Projektpartner: Am »CorASiV«-Projekt sind neben dem Fraunhofer IAIS die Institute IGD, IOSB, IME, ITWM und MEVIS beteiligt. Eine wissenschaftliche Veröffentlichung gemeinsam mit den epidemiologischen Expert*innen des Gesundheitsamtes ist geplant. Wir möchten uns besonders beim Gesundheitsamt Köln für die erfolgreiche Zusammenarbeit bedanken.

Mehr Informationen in der zugehörigen Publikation:

Temporal Graph Analysis for Outbreak Pattern Detection in COVID-19 Contact Tracing NetworksD. Antweiler, P. Welke, Machine Learning for Public Health Workshop at NeurIPS, 2020.

Dario Antweiler, Sebastian Ginzel,

28. April 2021

Themen

Dario Antweiler

Dario Antweiler ist Data Scientist am Fraunhofer Institut IAIS in Sankt Augustin im Geschäftsfeld Healthcare Analytics und betreut Projekte in den Themenbereichen Digitalisierung im Krankenhaus sowie Künstliche Intelligenz in der Pharmakologie. Sein Forschungsfeld ist Machine Learning auf Graphen und Netzwerken.

Dr. Sebastian Ginzel

Dr. Sebastian Ginzel ist Senior Data Scientist im Bereich Healthcare Analytics am Fraunhofer Institut IAIS. Er leitet Projekte zu den Themen Digitaler Zwilling in der Medizin, der Identifikation von Biomarkern und Subgruppen in klinischen Studien mittels maschinellen Lernens, sowie der Verbesserung der Versorgung von Patientinnen mit Hilfe künstlicher Intelligenz. In seiner Forschung widmet er sich der Frage wie subjektive Bewertungen von Expertinnen mit KI objektiviert werden können.

Weitere Blogartikel