Prof. Dr. Jürgen Bajorath und sein Team zeigen im Journal „Cell Reports Physical Science“ die Funktionsweise von Machine Learning-Modellen in der Arzneimittelforschung auf.
Welche chemischen Verbindungen haben das Potenzial, wirksame Medikamente zu werden? Diese Frage wird zunehmend durch den Einsatz von Maschinellem Lernen und Künstlicher Intelligenz beantwortet. Eine aktuelle Studie von Jannik P. Roth und Prof. Dr. Jürgen Bajorath, Professor an der Universität Bonn und am Bonn-Aachen-International Center for Information Technology (b-it) sowie Lamarr Area Chair für Life Sciences, bietet tiefere Einblicke in die Funktionsweise dieser technologischen Ansätze.
Wie treffen Machine Learning-Modelle ihre Vorhersagen?
In der Entwicklung neuer Medikamente sind Machine Learning-Modelle von zentraler Bedeutung. Sie prognostizieren, ob bestimmte chemische Verbindungen an pharmazeutische Zielproteine binden und dadurch eine gewünschte Wirkung entfalten. Diese Modelle sind jedoch oft schwer zu durchschauen, da ihre Entscheidungen nicht direkt nachvollziehbar sind. In ihrer Studie entwickelten die Forscher ein Machine Learning-Modellsystem, das die Vorhersagen eines Algorithmus formal erklären und vergleichen kann. Dies hilft, die Merkmale eines Wirkstoffmoleküls zu identifizieren, die maßgeblich für die Vorhersage verantwortlich sind.
Wichtigste Ergebnisse und Herausforderungen
Die Studie zeigte, dass ähnliche algorithmische Modelle fast identische Vorhersagen treffen können, diese jedoch auf unterschiedlichen Annahmen basieren. Dies erschwert die Interpretation der Ergebnisse und mindert ihren praktischen Nutzen. Um diese Herausforderung zu meistern, entwickelte das Team eine neue Methode zur Berechnung von Shapley-Werten, ein Konzept aus der Spieltheorie. Diese Werte quantifizieren den Beitrag einzelner Molekülmerkmale zur finalen Vorhersage, was eine genaue Analyse und Vergleichbarkeit ermöglicht.
Praktische Anwendungen und Zukunftsperspektiven
Die neue Methode zur Berechnung der Shapley-Werte ist nicht nur für die pharmazeutische Forschung relevant, sondern auch in anderen Bereichen anwendbar. Das zentrale Ergebnis der Studie unterstreicht, dass gleiche Vorhersagen durch unterschiedliche Modellwege erzielt werden können, was die Interpretation der Ergebnisse erschwert. Zukünftige Arbeiten werden sich daher auf die Verbesserung der Vergleichbarkeit und Interpretierbarkeit von Machine Learning-Modellen konzentrieren, um deren Einsatz in der Medikamentenentwicklung weiter zu optimieren.
Publikation
Jannik P. Roth, Jürgen Bajorath. „Machine Learning Models with Distinct Shapley Value Explanations for Chemical Compound Predictions Decouple Feature Attribution and Interpretation“, Cell Reports Physical Science. DOI: 10.1016/j.xcrp.2024.102110.
Interdisziplinärer Forschungsbereich Life Sciences
Der interdisziplinäre Forschungsbereich Life Sciences des Lamarr-Instituts zielt darauf ab, Maschinelles Lernen (ML), erklärbare Künstliche Intelligenz (KI) und Datenwissenschaft mit lebenswissenschaftlichen Disziplinen wie der Arzneimittelforschung und der medizinischen Forschung zu verbinden. Das Konzept Triangulären KI bildet die Grundlage des Life Sciences Bereichs. ML und andere KI-Methoden werden auf heterogene biowissenschaftliche Daten angewandt, die unterschiedliche wissenschaftliche Kontexte liefern, und nutzen Wissen aus verschiedenen Bereichen, um die Vorhersagemodelle auf die Versuchsplanung abzustimmen.