
Ein Überblick über das Marie-Skłodowska-Curie Doktorandennetzwerk „AI in Parkinson’s Disease“ (AIPD)
Worum handelt es sich bei Parkinson?
Die Parkinson-Erkrankung ist eine nicht heilbare, chronisch fortschreitende neurodegenerative Erkrankung, welche zu den häufigsten neurologischen Erkrankungen weltweit zählt. In den westlichen Ländern steigen die Fallzahlen stetig, möglicherweise aufgrund der Demographie. Die Erkrankung entwickelt sich über einen langen Zeitraum von bis zu 20 Jahren. Sie ist charakterisiert durch das Absterben von Dopamin produzierenden Zellen in der substantia nigra des Gehirns. Die Ursache der Erkrankung ist weitgehend unbekannt. Neben den bekannten motorischen Symptomen wie Tremor, Steifheit und Bewegungsverlangsamung treten häufig kognitive, psychiatrische und autonome Begleiterscheinungen auf. Vielfach lassen sich diese Symptome nur qualitativ beschreiben. Insgesamt entwickelt sich die Erkrankung bei verschiedenen Patienten sehr unterschiedlich. Die genaue Diagnose und Behandlung von Parkinson sind schwierig. Zentrale Herausforderungen sind daher:
- Wie können wir Parkinson frühzeitig diagnostizieren, und wie behandeln wir danach die auftretenden Symptome zum richtigen Zeitpunkt in optimaler Weise?
- Was geben wir den Patienten als Prognose für ihre persönliche Zukunft mit?
- Was machen wir, wenn Patienten nicht mehr auf gängige Therapien ansprechen?
Daten und KI als Teil einer Lösung
Um die oben genannten Herausforderungen angehen zu können, werden eine Vielzahl unterschiedlicher patientenbezogener Daten benötigt. Diese umfassen unter anderem:
- Hochdimensionale biologische Omics-Daten, also große biologische Datensammlungen, wie sie etwa bei der Analyse von Genen, RNA, Proteinen oder Stoffwechselprodukten entstehen
- Medizinische Bildgebung, speziell MRT-Aufnahmen des Gehirns
- Daten aus mobilen Gangsensoren und Sprachaufnahmen
- Strukturierte longitudinale Daten aus unterschiedlichen klinischen Studien
Während klassische statistische Verfahren üblicherweise genutzt werden, um konkrete Hypothesen für den durchschnittlichen Patienten zu testen, stoßen diese Methoden oft an Grenzen, wenn es darum geht, Vorhersagen für individuelle Patienten auf Basis von einer Vielzahl unterschiedlicher Variablen und Datenmodalitäten zu machen. Methoden der Künstlichen Intelligenz (KI) bieten neue Möglichkeiten, da sie komplexe und heterogene Daten systematisch auswerten und Muster erkennen können, die mit klassischen Verfahren nur schwer zugänglich sind. Hier setzt das europäische Marie-Skłodowska-Curie-Doktorandennetzwerk „Artificial Intelligence in Parkinson’s Disease“ (AIPD) an. Ziel ist es, moderne Methoden der Künstlichen Intelligenz systematisch mit klinischer und biologischer Forschung zu verbinden, um neue Möglichkeiten für die Vorhersage von Krankheitsrisiko, -subtyp und -verlauf zu schaffen sowie langfristig Therapieentscheidungen auf Basis von Daten und KI-Modellen zu personalisieren und zu optimieren. All dies soll auf einer transparenten, ethischen und rechtlich abgesicherten Basis im Sinne einer vertrauenswürdigen KI erfolgen.
Zentrale Fragestellungen der KI-Forschung bei Parkinson
AIPD versucht im Wesentlichen drei zentrale wissenschaftliche Kernfragen zu adressieren:
Wie kann KI helfen, Parkinson früher und individueller zu behandeln? Hierzu werden klinische Scores, Bildgebung, Omics-Daten, Sprachaufzeichnungen und digitale Gangsensorik genutzt. Auf Basis dieser Daten werden individuelle Risikoprofile erstellt, Parkinson gegenüber anderen Krankheitsbildern abgegrenzt (Differenzialdiagnose), Krankheitssubtypen identifiziert, Prognosemodelle entwickelt und das Ansprechen auf medikamentöse Behandlungen bewertet. Ziel ist es, datenbasierte Modelle zu entwickeln, die langfristig in der Lage sind, Therapieentscheidungen zu unterstützen und zu personalisieren. Außerdem sollen künftige klinische Studien so unterstützt werden, dass die Chance für neue Medikamente für Parkinsonpatienten verbessert wird.
Wie kann KI helfen, die Symptome der Parkinsonerkrankung mittels innovativer digitaler Technologien objektiver in ihrem Verlauf zu erfassen? Hierzu werden Algorithmen entwickelt, welche Muster aus Sprachaufzeichnungen und digitaler Gangsensorik erkennen. Auf Basis der Genauigkeit, die diese Modelle erzielen, lassen sich Aussagen über den klinischen Nutzen der entsprechenden digitalen Technologien ableiten.
Wie lassen sich vertrauenswürdige, erklärbare KI-Modelle entwickeln, die klinisch nachvollziehbar sowie rechtlich und ethisch verantwortbar sind? Hierbei wird insbesondere Wert auf die Erklärbarkeit und klinische Interpretierbarkeit von KI-basierten Modellvorhersagen gelegt. Außerdem wird die Generalisierbarkeit von Modellen kritisch beleuchtet. Aus rechtlicher Sicht ist außerdem das Zusammenspiel mit datenschutzrechtlichen Bestimmungen, der KI-Verordnung und der Medizinproduktverordnung essenziell. Zu guter Letzt erfolgt eine ethische Gesamtbewertung des Projektes.
Herausforderungen und Lösungsansätze aus datenwissenschaftlicher Sicht
Die Entwicklung von KI-Verfahren zur Beantwortung der oben genannten Fragestellungen ist mit einer ganzen Reihe von Herausforderungen konfrontiert:
- Datenzugang: Der Zugang zu patientenbezogenen Daten ist in Europa sehr streng reguliert. Ein signifikanter Aufwand geht daher in die Beantragung von Datenzugängen und das Abschließen rechtlicher Vereinbarungen zur Datennutzung.
- Datenharmonisierung: Medizinische Daten aus einer speziellen Studie sind in der Regel nicht repräsentativ für die Gesamtbevölkerung. Daher ist es unerlässlich, Modelle aus unterschiedlichen Studien zu evaluieren, um die Generalisierbarkeit abzuschätzen. Allerdings sind Daten aus verschiedenen Studien in der Regel strukturell nicht kompatibel miteinander. Daher müssen sie erst anhand eines gemeinsamen Datenmodells harmonisiert werden. Hierzu werden im Rahmen von AIPD unter anderem auch Agentensysteme entwickelt und getestet.
- Begrenzte Fallzahlen: Verglichen mit anderen Anwendungsbereichen sind Daten in der Medizin immer noch von überschaubarer Größe, vor allem in Bezug auf typische Fallzahlen in klinischen Studien. Dies stellt besondere Herausforderungen für KI-Verfahren dar.
- Kurze Verläufe mit hoher Heterogenität: Klinische Studien laufen zwar häufig über mehrere Jahre, aber die Zahl der Besuche im Krankenhaus, bei denen Daten entstehen, ist sehr begrenzt. Zudem brechen viele Teilnehmer*innen eine Studie irgendwann ab, was zu systematisch fehlenden Werten in den Daten führt. Gleichzeitig ist die Heterogenität in den klinischen Verläufen hoch. Die Entwicklung von KI-Modellen für klinische Studien ist daher sehr komplex.
- Multimodale Daten: Viele der oben genannten Fragestellungen lassen sich nur durch eine Kombination unterschiedlicher Datenmodalitäten beantworten. Beispielsweise ist das Risiko der Erkrankung ableitbar aus einer Kombination aus genetischer Prädisposition, Alter, Umwelteinflüssen und Lebensstil. Dieser Sachverhalt macht die Entwicklung und Evaluation geeigneter KI-Modelle aufwendig und schwierig.
- Hochdimensionale Daten: Viele Daten in der Medizin sind sehr hochdimensional – das heißt mit sehr vielen Merkmalen pro Fall – bei gleichzeitig begrenzter Zahl von Patienten. Beispiele hierfür umfassen Omics-Daten und medizinische Bilddaten. Hochdimensionale Daten können sehr leicht zur Überanpassung von KI-Modellen und damit zu schlechter Vorhersagegenauigkeit führen.
- Mangelnde Interpretierbarkeit von Sensordaten: Daten aus digitalen Geräten, wie beispielsweise Smartphones oder tragbare Gangsensoren, stellen eine neue und sehr interessante Datenquelle für die Medizin dar. Jedoch sind die Rohdaten häufig zunächst nur schwer interpretierbar.
Um den oben genannten Herausforderungen zu begegnen, werden im Rahmen von AIPD eine ganze Reihe datenwissenschaftlicher Ansätze angepasst, anwendungsbezogen weiterentwickelt und teilweise auch kombiniert:
- KI-Agenten: Sprachmodelle (Large Language Models) und darauf aufbauende Agentensysteme sollen bei der Harmonisierung von Studiendaten unterstützen.
- Multimodale Datenfusion: Daten unterschiedlicher Modalitäten (z. B. Genetische Varianten, Fragebögen zu Lebensstil oder Schlafstörungen) sollen geeignet kombiniert werden, um optimale Vorhersagegenauigkeit zu erzielen.
- Domänenadaption: Modelle sollen auf Basis harmonisierter Daten übertragbar zwischen verschiedenen Studien gemacht werden.
- KI-Grundlagenmodelle: Die in den letzten Jahren für viele Datenmodalitäten (bspw. gesprochene Sprache) entwickelten Grundlagenmodelle sollen gegen etablierte Alternativen hinsichtlich ihrer Vorhersagegenauigkeit, aber auch ihrer Erklärbarkeit verglichen werden.
- Zeitreihenmodelle: Viele oben skizzierte Fragestellungen sind nur durch unterschiedliche Modellierungsansätze für Zeitreihen adressierbar. Diese umfassen auch generative Ansätze, welche zur Simulation möglicher künftiger Krankheitsverläufe auf individueller Ebene verwendet werden sollen.
- Hybride KI: Einige der Herausforderungen auf der Datenseite lassen sich nur durch die Kombination verschiedener Modellierungstechniken angehen. Beispielsweise werden künstliche neuronale Netze mit Differentialgleichungen kombiniert.
- Kausales Maschinelles Lernen: Viele Fragestellungen in der Medizin lassen sich nicht nur durch bloße Vorhersagen lösen. So ist beispielsweise die Frage nach dem möglichen Nutzen einer Veränderung des Lebensstils nicht durch übliche Methoden des maschinellen Lernens zu beantworten. Hier kommen moderne Verfahren aus dem Schnittbereich von KI und Statistik ins Spiel.
Vertrauenswürdigkeit von KI-Verfahren als zentraler Aspekt
Ein zentraler Aspekt bei der weitergehenden Nutzung von KI in der Medizin ist deren Vertrauenswürdigkeit. Diese umfasst mehrere in AIPD behandelte Aspekte wie Generalisierbarkeit, Erklärbarkeit, Ethik sowie Datenschutz und Regulierung:
- Die mangelnde Generalisierbarkeit von KI-Modellen ist auf Grund der oben erwähnten Limitationen von Studiendaten ein Hauptproblem der Forschung insgesamt. AIPD widmet sich daher auf Basis harmonisierter Daten umfassend der externen Validierung von Modellen sowie deren domänenspezifischer Anpassung.
- KI-Modelle in der Medizin bedürfen einer sorgfältigen Interpretation, um sinnlose Ergebnisse zu vermeiden und bei einer möglichen späteren Nutzung erläutern zu können, wie ein bestimmtes Ergebnis zustande gekommen ist.
- Die Nutzung sehr sensitiver Daten, wie zum Beispiel Sprachaufnahmen, wirft ethische Fragen auf. Hier muss eine sorgfältige Abwägung gegenüber dem möglichen medizinischen Nutzen getroffen werden. KI-Verfahren fallen unter eine ganze Reihe relevanter Gesetzgebungen und Regulierungen, die beachtet und verstanden werden müssen. Außerdem müssen bei der Anwendung von KI-Algorithmen die existierenden Datenschutzbestimmungen eingehalten werden.
Bedeutung für die KI-Forschung bei Lamarr
Die interdisziplinäre Forschung von AIPD trägt unmittelbar zu den Kernzielen des Life Sciences & Health Bereiches von Lamarr bei und verdeutlicht, wie datengetriebene KI-Ansätze in der medizinischen Forschung eingesetzt werden können: AIPD entwickelt theoretisch fundierte KI-Algorithmen, die kausales Denken nutzbar machen und KI-Grundlagenmodelle kritisch nutzt und bewertet. Darüber hinaus ist die Erklärbarkeit von KI-Modellen ein zentraler Bestandteil der Forschungsstrategie von AIPD. Durch die Nutzung von Studiendaten mehrerer Zentren können KI-Ansätze kritisch hinsichtlich ihrer Generalisierbarkeit bewertet werden. Insgesamt ist das Ziel von AIPD, die künftige Patientenversorgung durch robuste Entscheidungsunterstützung zu unterstützen.