Der Forschungsbereich Life Sciences ist ein hoch interdisziplinärer Bestandteil der Forschung am Lamarr-Institut, der sich hauptsächlich auf maschinelles Lernen (ML) in den Lebenswissenschaften konzentriert, einschließlich Chemie und Pharmaforschung, und dabei Konzepte aus der erklärbaren Künstlichen Intelligenz (XAI) nutzt, um Vorhersagen nachvollziehbar zu machen. Die Forschung in diesem Bereich zielt darauf ab, KI-Innovationen und -Anwendungen in der interdisziplinären Life-Science-Forschung voranzutreiben und wissenschaftliche Entdeckungen sowie Erkenntnisse über verschiedene Disziplinen hinweg zu fördern. In diesem Blogbeitrag stellen wir vor, wie Lamarr-Forschende KI und ML in den Life Sciences anwenden.
Unser Ansatz entspricht dem Forschungsparadigma des Lamarr-Instituts der „Triangulären KI“. Durch den Fokus auf ML und XAI geht der Forschungsbereich Life Sciences die Herausforderung an, die komplexen „Black-Box“-Entscheidungsprozesse von ML-Modellen zu verstehen, was für zwei wesentliche Aspekte in den Lebenswissenschaften entscheidend ist:
- Vertrauen und Transparenz für Nicht-Expert*innen schaffen – Modelle des Maschinellen Lernens und ihre Vorhersagen müssen vertrauenswürdig und verständlich sein, insbesondere für Nicht-Expert*innen wie experimentelle Forscher*innen, die diese Vorhersagen für das experimentelle Design nutzen. Ohne klare Erklärungen für KI-gestützte Vorhersagen herrscht oft Skepsis und Zurückhaltung gegenüber den Ergebnissen. Dies ist besonders wichtig in Bereichen wie personalisierte Medizin oder Pharmaforschung, wo Entscheidungen Menschenleben betreffen oder erhebliche finanzielle Investitionen beinhalten können.
- Wissenschaftliches Wissen erweitern – In interdisziplinären Kontexten sollte KI auch zur Erweiterung wissenschaftlicher Kenntnisse und zur Analyse komplexer, kontextabhängiger Aufgaben beitragen, wie der Erforschung biologischer oder chemischer Mechanismen. Eine der Hauptaufgaben in der Forschung ist es, die Expertise von Praktiker*innen und KI-Expert*innen zu verbinden und die Kommunikation und Zusammenarbeit zu fördern, um wissenschaftliche Fortschritte voranzutreiben.
Computergestützte Pharmaforschung
Die Life Science Informatics (LSI) Abteilung am Bonn-Aachen International Center for Information Technology (b-it), geleitet von Prof. Dr. Jürgen Bajorath, ist eine der tragenden Säulen im Bereich Life Sciences am Lamarr-Institut. Der Forschungsschwerpunkt der LSI-Abteilung liegt auf der Entwicklung und Anwendung von ML- und XAI-Methoden für die computergestützte medizinische Chemie- und Pharmaforschung. Zentrale Forschungsobjekte sind dabei kleine molekulare Liganden – Substanzen wie Cofaktoren, Metaboliten oder Wirkstoffkandidaten – die spezifisch an biologische Makromoleküle, insbesondere pharmakologisch relevante Proteine, binden, um deren Aktivität oder Funktion zu hemmen oder zu steigern.
Kleine Moleküle werden in verschiedenen Formen dargestellt, wie molekularen Graphen, binären Vektoren (sogenannte molekulare Fingerabdrücke), textuellen Repräsentationen (Zeichenfolgen) oder Bildern. Diese Darstellungen dienen als Eingaben für verschiedene (Deep Learning) Modelle, die chemische Struktur-Eigenschafts-Beziehungen lernen können. Dieses Verfahren kann sowohl für generative als auch prädiktive molekulare Designanwendungen genutzt werden.
Hauptforschungsprojekte
Ein aktuelles Hauptprojekt im Bereich Life Sciences ist die Zusammenarbeit mit dem TüCAD2 Academic Drug Discovery Center der Universität Tübingen, mit dem Fokus auf die Erforschung der Proteinkinase in der Pharmaforschung und insbesondere der sogenannten „dunklen Kinome“, also wenig untersuchten menschlichen Kinasen. Proteinkinasen sind Enzyme, die die Phosphorylierung anderer Proteine katalysieren, was oft deren Aktivität reguliert. Ein Ziel des Projekts mit TüCAD2 ist die Identifikation neuer aktiver Verbindungen, die auf dunkle Kinasen abzielen, um deren Rolle in der intrazellulären Signalübertragung und möglichen Beteiligung an Krankheiten wie Krebs oder immunologischen Erkrankungen besser zu verstehen. Dieses Projekt veranschaulicht die enge Interaktion zwischen großangelegter Wirkstoffdatenanalyse, prädiktiven Modellen, medizinischer Chemie und Pharmakologie.
Ein weiterer wichtiger Forschungsschwerpunkt ist die Entwicklung und Anwendung „biochemischer Sprachmodelle“ auf Basis von Transformer-Architekturen. Diese spezialisierten Sprachmodelle nutzen textuelle Darstellungen von kleinen Molekülen und/oder Proteinen und ermöglichen prädiktive Aufgaben, die bisher schwer oder unmöglich zu bewältigen waren, wie z. B. das Design neuer Wirkstoffe auf Basis biologischer Sequenzdaten. Zudem ermöglicht die Erzeugung von Mehrzielverbindungen (Verbindungen, die an mehrere Zielproteine binden können) ein weiteres wichtiges Anwendungsfeld. Die Fähigkeit, an mehrere Zielproteine zu binden, ist oft in der Pharmaforschung von Vorteil, da die Behandlung von Pathologien wie Krebs von einer gleichzeitigen Interferenz mit mehreren Proteinen profitieren kann. Kürzlich entwickelten wir ein Transformer-Modell, das als Eingabe Einzelzielverbindungen verwendet und als Ausgabe Zweizielverbindungen mit der gewünschten Aktivität generiert.
XAI-Ansätze spielen in unserem Forschungsbereich Life Sciences am Lamarr-Institut eine entscheidende Rolle, wie bereits erwähnt. Hier werden neue Konzepte und Methoden entwickelt, um nicht nur zu verstehen, wie ML-Modelle spezifische Vorhersagen treffen (Stufe 1), sondern auch diese Vorhersagen aus einer chemischen oder biologischen Perspektive zu interpretieren (Stufe 2). In einem kürzlich durchgeführten Projekt wurden die Lerncharakteristika von graph-basierten neuronalen Netzwerken (GNNs), die im Wirkstoffdesign eingesetzt werden, anhand einer neu entwickelten Methodik namens EdgeSHAPer gründlich untersucht. Diese Methode nutzt Shapley-Werte aus der kooperativen Spieltheorie, um die Bedeutung bestimmter Kanten in GNN-Vorhersagen zu bewerten und tiefere Einblicke in die Relevanz einzelner Merkmale zu gewinnen.
Die Erklärung von Vorhersagen auf zwei Ebenen ermöglicht es Forschenden, Kausalbeziehungen zwischen ML-Modellvorhersagen und den gelernten chemischen oder biologischen Prozessen zu untersuchen, z. B. der gezielten Hemmung eines Proteins durch neu entworfene Verbindungen. Diese Erforschung von Kausalität überschneidet sich natürlich mit menschlichem Denkvermögen und eröffnet Möglichkeiten zur Verbindung der KI-Forschung mit kognitiven Wissenschaften und philosophischen Konzepten. Diese interdisziplinäre Perspektive bietet Wachstumschancen für unseren Forschungsbereich Life Sciences und erweitert den Horizont über die Kernbereiche der Lebenswissenschaften hinaus.
Erfahren Sie hier mehr über den interdisziplinären Forschungsbereich Life Sciences am Lamarr-Institut.