KI-Enthüllung in der Arzneimittel-Forschung: Die Forschung von Lamarr-PI Prof. Dr. Bajorath und Team bringt überraschende Ergebnisse zutage 

- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)

In einer neuen Studie haben Forschende an der Universität Bonn unter der Leitung von Prof. Dr. Jürgen Bajorath, Chair für Lebenswissenschaften und Principal Investigator am Lamarr-Institut für Maschinelles Lernen und Künstliche Intelligenz,  wegweisende Ergebnisse im Bereich der Künstlichen Intelligenz (KI) in der Arzneimittelforschung veröffentlicht. Die Forschung, veröffentlicht in „Nature Machine Intelligence,“ wirft ein neues Licht auf die Funktionsweise von KI-Anwendungen, die bisher als Black Box wahrgenommen wurden. 

Die Studie konzentrierte sich auf die Analyse von „Graph Neuronalen Netzen“ (GNNs), eine Form des Maschinellen Lernens, die in der Arzneimittelforschung für die Vorhersage von Arzneimittelwirksamkeiten eingesetzt wird. Bisher galten diese Anwendungen als undurchsichtige Black Boxes, da es schwierig war, nachzuvollziehen, wie sie zu ihren Prognosen gelangen. 

Mehr Licht ins Dunkel der „Black Box“ mit dem Analysetool „EdgeSHAPer“  

Die Forschenden entwickelten die „EdgeSHAPer“-Methode, um die Arbeitsweise von sechs verschiedenen GNN-Modellen im Detail zu untersuchen. Das Ergebnis war überraschend: Die meisten GNNs neigten dazu, sich weitgehend an bekannte Daten zu erinnern, anstatt spezifische chemische Wechselwirkungen zu berücksichtigen, wie es in der Arzneimittelforschung notwendig ist. 

Prof. Dr. Jürgen Bajorath, Principal Investigator des Lamarr-Instituts und renommierter Chemieinformatiker an der Universität Bonn und dem Bonn Aachen International Center for Information Technology (b-it), kommentierte die Ergebnisse: „Die GNNs sind sehr abhängig von den Daten, mit denen sie trainiert werden. Statt sich auf die Kernaspekte spezifischer Protein-Wirkstoff-Wechselwirkungen zu konzentrieren, erinnern sich die Modelle hauptsächlich an chemisch ähnliche Moleküle, die sie im Training kennengelernt haben.“ 

Die Wissenschaftler*innen verglichen die Vorgehensweise der GNNs mit dem „Klugen-Hans-Effekt“, einer Analogie zu einem Pferd, das scheinbar rechnen konnte, tatsächlich jedoch Nuancen in der Umgebung wahrnahm und so häufig zum richtigen Ergebnis kam. Prof. Bajorath betonte, dass die Vorhersagen der GNNs weitgehend überbewertet seien, da ähnlich qualitativ hochwertige Prognosen mit chemischem Wissen und einfacheren Methoden erstellt werden könnten. 

Neue Chancen für die Arzneimittelforschung und die Vorhersage von Arzneimittelwirksamkeiten 

Trotz der kritischen Einschätzung der aktuellen KI-Anwendungen gibt es laut unserem Principal Investigator Prof. Bajorath Möglichkeiten für Verbesserungen. Einige der untersuchten GNN-Modelle zeigten eine Tendenz, mehr Wechselwirkungen zu lernen, wenn die Wirksamkeit bekannter Wirkstoffe zunahm. Dies könnte laut Bajorath durch modifizierte Trainingsmethoden weiterentwickelt werden. 

Der Lamarr-PI sieht in den Ergebnissen eine Chance, mehr Transparenz in die „Black Box“ der Künstlichen Intelligenz zu bringen. Die entwickelten Analysetools wie der „EdgeSHAPer“ könnten einen Beitrag dazu leisten, zu verstehen, wie komplexe Modelle ihre Vorhersagen treffen.  

Erfahren Sie in der aktuellen Veröffentlichung unseres Principle Investigators in „Nature Machine Intelligence“ mehr über das Thema

Andrea Mastropietro, Giuseppe Pasculli, and Jürgen Bajorath: Learning characteristics of graph neural networks predicting protein-ligand affinities, Nature Machine Intelligence, DOI: 10.1038/s42256-023-00756-9

- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
Der Chemieinformatiker und Lamarr PI Prof. Dr. Jürgen Bajorath vom LIMES-Institut der Universität Bonn und dem Bonn-Aachen International Center for Information Technology (b-it). © University of Bonn
Bild2 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
Relative Anteile von Kanten in Protein-Liganden Wechselwirkungs-Graphen, die Vorhersagen von sechs GNNs für verschiedene Affinitätsunterbereiche bestimmen. Die farbcodierten Balken vergleichen die mittleren Anteile von Protein-, Liganden- und Interaktionskanten unter den Top-25-Kanten jeder Vorhersage, bestimmt mit EdgeSHAPer. Abbildung: A. Mastropietro und J. Bajorath © A. Mastropietro and J. Bajorath

Themen

Weitere News