{"id":4796,"date":"2023-05-10T16:40:38","date_gmt":"2023-05-10T16:40:38","guid":{"rendered":"https:\/\/lamarr-institute.org\/blog\/graphen-basierten-ki-modelle\/"},"modified":"2025-11-12T14:51:36","modified_gmt":"2025-11-12T14:51:36","slug":"graphen-basierten-ki-modelle","status":"publish","type":"blog","link":"https:\/\/lamarr-institute.org\/de\/blog\/graphen-basierten-ki-modelle\/","title":{"rendered":"Graph Neural Networks: Eine Einf\u00fchrung in die Welt der Graphen-basierten KI-Modelle"},"content":{"rendered":"\n<p>Tagt\u00e4glich interagieren wir auf der Arbeit, beim Sport oder auch im Internet in Form von sozialen Netzwerken mit anderen Leuten innerhalb sozialer Strukturen. Graphen sind ein grundlegendes Konzept der Informatik, die in der Lage sind, diese komplexen Systeme und Beziehungen zu modellieren.<\/p>\n\n\n\n<p>Im Bereich der KI finden Graph Neural Networks (GNNs) Anwendung. GNNs sind k\u00fcnstliche neuronale Netze, die auf Daten mit Graphstruktur arbeiten und die F\u00e4higkeit besitzen, eben jene Beziehungen zu analysieren. Um Aufgaben wie die Knotenklassifikation (z. B. zur Erkennung von Fake-Accounts in sozialen Netzwerken), die Vorhersage von Beziehungen (z. B. von biologischen Interaktionen zwischen Proteinen) oder die <a href=\"https:\/\/lamarr-institute.org\/de\/ml-klassifikation\/\">Klassifikation<\/a> von ganzen Graphen (z. B. zur Bestimmung der Toxizit\u00e4t eines Molek\u00fcls auf der Grundlage seiner Struktur) zu erm\u00f6glichen, nutzen GNNs das Message Passing Modell, bei dem Informationen von benachbarten Knoten kombiniert werden. Doch sehen wir uns zun\u00e4chst an, was Graphen eigentlich sind.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Was sind Graphen?<\/h2>\n\n\n\n<p>Ein einzelner Graph ist die mathematische Abstraktion einer Menge von Objekten (Knoten) und der Verbindungen zwischen diesen Objekten (Kanten). Die Kanten k\u00f6nnen entweder gerichtet oder ungerichtet sein. In gerichteten Graphen k\u00f6nnen Kanten nur in eine Richtung durchlaufen werden, w\u00e4hrend in ungerichteten Graphen die Richtung keine Rolle spielt. Diese Struktur eignet sich zur Modellierung von Beziehungen zwischen verschiedenen Objekten und kann dabei helfen, komplexe Zusammenh\u00e4nge zu visualisieren und zu analysieren. Ein anschauliches Beispiel eines Graphen ist ein U-Bahn-Netz, in dem jede Station durch einen Knoten repr\u00e4sentiert wird und jede Kante eine direkte Verbindung zwischen zwei Stationen darstellt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"328\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_0-1024x328.jpg\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17164\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_0-1024x328.jpg 1024w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_0-300x96.jpg 300w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_0-768x246.jpg 768w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_0.jpg 1472w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Abbildung 1: Bonner Stadtbahnnetz. Stationen k\u00f6nnen als Knoten und direkte Verbindungen zwischen zwei Stationen als Kanten interpretiert werden.<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Was unterscheidet GNNs von herk\u00f6mmlichen k\u00fcnstlichen neuronalen Netzen?<\/h2>\n\n\n\n<p>Herk\u00f6mmliche neuronale Netze sind auf die Verarbeitung von Vektoren oder Matrizen, also Daten, die eine regelm\u00e4\u00dfige Struktur aufweisen, spezialisiert und liefern in vielen Anwendungsf\u00e4llen hervorragende Ergebnisse. Schwierigkeiten haben sie jedoch bei der Verarbeitung von Beziehungen zwischen Datenpunkten sowie von Daten ohne feste Struktur.<\/p>\n\n\n\n<p>Diese Daten und ihre Beziehungen werden jedoch durch Graphen modelliert. Wie in Abbildung 2 verdeutlicht, sind die Knoten eines Graphen nicht an eine feste Position im Raum gebunden, sodass die k\u00fcrzeste Distanz zwischen zwei Knoten durch den k\u00fcrzesten Weg \u00fcber die Kanten und nicht durch die Entfernung im Raum definiert ist. Die Beziehungen zwischen Datenpunkten werden durch die Kanten verk\u00f6rpert.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"637\" height=\"327\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_1.jpg\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17167\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_1.jpg 637w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_1-300x154.jpg 300w\" sizes=\"auto, (max-width: 637px) 100vw, 637px\" \/><figcaption class=\"wp-element-caption\">Abbildung 2: Zwei unterschiedliche Visualisierungen des gleichen Graphen.<\/figcaption><\/figure>\n\n\n\n<p>Um mit diesen Beziehungen und Daten ohne feste Struktur arbeiten zu k\u00f6nnen, wurden GNNs entwickelt. Diese nutzen den Aufbau des Graphen, um lokale Informationen \u00fcber die Nachbarschaft der Knoten zu aggregieren und zu verarbeiten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Wie GNNs funktionieren \u2013 Das Message Passing Modell<\/h2>\n\n\n\n<p>Um die Funktionsweise von GNNs zu verstehen, ist es notwendig, sich zun\u00e4chst mit dem Message Passing Modell vertraut zu machen. Dessen Grundidee besteht darin, dass Knoten untereinander Nachrichten austauschen, in denen sie eigene Merkmale an ihre Nachbarn weitergeben. Diese Informationen werden dann kombiniert, um aktualisierte Repr\u00e4sentationen der Knoten zu erzeugen. Dabei wird davon ausgegangen, dass miteinander verbundene Knoten \u00e4hnliche Eigenschaften aufweisen.<\/p>\n\n\n\n<p>Konkret bedeutet das, dass jeder Knoten einen Vektor von Merkmalen erh\u00e4lt, der seine aktuelle Repr\u00e4sentation darstellt. Dieser Vektor wird dann mit den Merkmalsvektoren seiner Nachbarn kombiniert, um eine neue Repr\u00e4sentation zu generieren, die wiederum im n\u00e4chsten Schritt an seine Nachbarn weitergegeben wird. Nach $k$ Wiederholungen enth\u00e4lt die Repr\u00e4sentation eines Knotens die Informationen der benachbarten Knoten, die $k$ Schritte entfernt sind.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"492\" height=\"481\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_2.jpg\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17169\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_2.jpg 492w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_2-300x293.jpg 300w\" sizes=\"auto, (max-width: 492px) 100vw, 492px\" \/><figcaption class=\"wp-element-caption\">Abbildung 3: Betrachtete Nachbarn bei einer gegebenen Schrittweite $k$.<\/figcaption><\/figure>\n\n\n\n<p>Diese iterative Methode der Nachrichtenweitergabe erm\u00f6glicht es den GNNs, eine Repr\u00e4sentation des Graphen zu generieren, indem sie die Informationen von jedem Knoten und dessen Nachbarn kombinieren. Die endg\u00fcltige Repr\u00e4sentation des Graphen kann dann zur Klassifikation, Vorhersage von Beziehungen oder anderen Aufgaben genutzt werden.<\/p>\n\n\n\n<p>Hierzu kommen verschiedene Arten von GNNs zum Einsatz, die sich in der Methode des Message Passings unterscheiden. Drei beliebte Modelle sind Graph Convolutional Networks (GCN), Graph Attention Networks (GATs) und GraphSAGE. Im Folgenden wird beispielhaft auf Graph Convolutional Networks eingegangen. Einen detaillierteren Einblick in die Anwendungen von GATs finden Sie im Beitrag <a href=\"https:\/\/machinelearning-blog.de\/grundlagen\/graph-attention-network\/\" target=\"_blank\" rel=\"noopener\">Automatische Klassifikation eines Publikationsnetzwerks mithilfe eines Graph Attention Networks.<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Graph Convolutional Networks<\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"697\" height=\"362\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_3.jpg\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17171\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_3.jpg 697w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Blogbeitrag-GNN-GCN-GoloPohl_3-300x156.jpg 300w\" sizes=\"auto, (max-width: 697px) 100vw, 697px\" \/><figcaption class=\"wp-element-caption\">Abbildung 4: Aufbau eines Graph Convolutional Networks<\/figcaption><\/figure>\n\n\n\n<p>Graph Convolutional Networks sind eine beliebte Methode zur Klassifizierung von Knoten in einem Graphen. Sie bestehen \u00e4hnlich wie klassische Convolutional Neural Networks aus $k$ Schichten, in denen eine Repr\u00e4sentation der Knoten in der jeweiligen verdeckten Schicht gelernt wird. Um diese Repr\u00e4sentationen erlernen zu k\u00f6nnen, wird zun\u00e4chst die Adjazenzmatrix des Graphen ben\u00f6tigt.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1550\" height=\"1688\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17318\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2.png 1550w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2-275x300.png 275w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2-940x1024.png 940w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2-768x836.png 768w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_2-1410x1536.png 1410w\" sizes=\"auto, (max-width: 1550px) 100vw, 1550px\" \/><figcaption class=\"wp-element-caption\">Abbildung 5: Gegebener Graph mit zugeh\u00f6riger Adjazenzmatrix<\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1692\" height=\"1713\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-17323\" title=\"\" srcset=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1.png 1692w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1-296x300.png 296w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1-1011x1024.png 1011w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1-768x778.png 768w, https:\/\/lamarr-institute.org\/wp-content\/uploads\/Abbildung_5_1-1-1517x1536.png 1517w\" sizes=\"auto, (max-width: 1692px) 100vw, 1692px\" \/><\/figure>\n\n\n\n<p>Das Erlernen der Repr\u00e4sentationen erfolgt durch das Multiplizieren der Adjazenzmatrix $A$ mit der Node-Feature Matrix $X$, in der die Merkmalsvektoren aller Knoten zusammengetragen sind, und einer Gewichtsmatrix $W$. Jede verdeckte Schicht besitzt je eine zugeh\u00f6rige Matrix $W^{(k)}$. In der Praxis haben sich zwei Schichten bew\u00e4hrt, da sie eine ausreichend komplexe Darstellung des Graphen erm\u00f6glichen, ohne zu einer \u00dcberanpassung des Modells an die Trainingsdaten zu f\u00fchren.<\/p>\n\n\n\n<p>Um nicht-lineare Beziehungen zwischen Knoten erfassen zu k\u00f6nnen, wird eine nicht-lineare Aktivierungsfunktion $\\sigma$, wie z.B. die $ReLU (f(x) = \\max(0, x))$, hinzugef\u00fcgt, sodass sich die Berechnung der Repr\u00e4sentationen in der n\u00e4chsten Schicht wie folgt ergibt:<\/p>\n\n\n\n<p>$H^{(k+1)} = \\sigma(AH^{(k)}W^{(k)})$<\/p>\n\n\n\n<p>Durch die Multiplikation der Adjazenzmatrix   und der Node-Feature Matrix   werden die Informationen der benachbarten Knoten aufsummiert und schlie\u00dflich durch Multiplizieren mit einer Gewichtsmatrix   gewichtet. Die Gewichtsmatrix enth\u00e4lt die Gewichte, die das Modell lernt, um die Beziehungen zwischen den Knoten im Graphen zu modellieren. Diese Gewichte werden dann w\u00e4hrend des Lernprozesses mittels des <a href=\"https:\/\/de.wikipedia.org\/wiki\/Gradientenverfahren\" target=\"_blank\" rel=\"noreferrer noopener\">Gradientenabstiegsverfahrens<\/a> angepasst, um eine bestm\u00f6gliche Repr\u00e4sentation zu generieren.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Fazit<\/h2>\n\n\n\n<p>Graph Neural Networks sind ein leistungsstarkes Instrument zur Analyse und Vorhersage von Beziehungen zwischen Objekten. Sie unterscheiden sich von herk\u00f6mmlichen k\u00fcnstlichen neuronalen Netzen dadurch, dass sie Beziehungen zwischen Datenpunkten ber\u00fccksichtigen, indem sie Daten in Form von Graphen verarbeiten k\u00f6nnen. Dabei nutzen sie die Message Passing Methode, um durch Informationstransfer mit Nachbarn die Knotenrepr\u00e4sentationen zu lernen. Diese k\u00f6nnen anschlie\u00dfend zur Knotenklassifikation, Vorhersage von Beziehungen oder zur Graphenklassifikation verwendet werden. Infolgedessen finden GNNs in vielen Bereichen Anwendung und werden voraussichtlich auch in Zukunft eine wichtige Rolle spielen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Zahlreiche allt\u00e4gliche Strukturen lassen sich als Graph darstellen. Graph Neural Networks nutzen deren Aufbau, um Informationen von benachbarten Knoten zu sammeln und in Graphen die Beziehungen von Objekten untereinander zu analysieren.<\/p>\n","protected":false},"author":9,"featured_media":4807,"template":"","meta":{"_acf_changed":false,"footnotes":""},"blog-category":[1416,390,732],"blog-tag":[1515,1533],"class_list":["post-4796","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-alle-blogbeitraege","blog-category-grundlagen","blog-category-ml-classroom-de","blog-tag-graph-neural-networks-de","blog-tag-klassifikation"],"acf":[],"publishpress_future_workflow_manual_trigger":{"enabledWorkflows":[]},"_links":{"self":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4796","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/types\/blog"}],"author":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/users\/9"}],"version-history":[{"count":0,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4796\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media\/4807"}],"wp:attachment":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media?parent=4796"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-category?post=4796"},{"taxonomy":"blog-tag","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-tag?post=4796"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}