Wissenschaftliches Arbeiten leicht gemacht: Effizienter Umgang mit Literatur

00 Blog Jakobs Wissenschaftliches Arbeiten leicht gemacht 9 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© apinan & alex aldo/stock.adobe.com & ML2R

Selbstorganisation ist eine wichtige Fähigkeit in vielen Branchen. In der Forschung ist dies besonders der Fall, da hier oft mehrere Projekte ohne fest vorgegebene Aufgabenstellungen jongliert werden müssen. Besonders das Auseinandersetzen mit wissenschaftlichen Artikeln ist eine potenziell endlose Aufgabe. Um diesen Prozess zu organisieren, stellen wir Tricks und Tools vor. Diese haben wir in einer Reihe von Interviews mit ML2R-Forscher*innen zu ihrem Forschungsalltag herausgearbeitet.

Literaturrecherche: Geeignete Artikel zur eigenen Fragestellung finden

Ein großer Teil der Forschung besteht darin, sich mit dem aktuellen Stand der Wissenschaft vertraut zu machen. Besonders im Feld des Maschinellen Lernens ändert sich dieser sehr schnell, da neue Erkenntnisse und Studien nicht nur auf Fachkonferenzen und in Fachzeitschriften, sondern auch auf Plattformen wie arxiv.org als Vorabversionen veröffentlicht werden. Bei Letzteren entfällt allerdings oft der Prozess des Peer Review, in dem Kolleg*innen aus dem gleichen Forschungsfeld die Ergebnisse von Studien bewerten. Solche Ergebnisse sind also mit Vorsicht zu genießen, können aber nichtsdestotrotz wertvolle Einblicke in den aktuellen Forschungsstand liefern. Aufgrund der hohen Dichte an Arbeiten im Gebiet des Maschinellen Lernens ist es essenziell, schnell und zuverlässig einschätzen zu können, ob die gefundenen Artikel relevant für die eigene Fragestellung sind. Dazu benutzen einige Forscher*innen den Ansatz, dass sie die Kapitel Abstract, Introduction sowie Conclusion von Fachartikeln zuerst lesen. Abstract fasst die Kernaussagen der Arbeit zusammen, Introduction motiviert das Thema und Conclusion ordnet die Ergebnisse in das weitere Forschungsfeld ein. Da die meiste Literatur des Themengebiets nach diesem Schema aufgebaut ist, können so Kernaussagen und bearbeitete Fragestellungen schnell und zuverlässig herausgefunden und mit den eigenen Anforderungen abgeglichen werden. So sparen Forschende Zeit und selektieren tendenziell relevantere Artikel.

Google bietet mit Google Scholar eine spezialisierte Suchmaschine an, in der veröffentlichte wissenschaftliche Arbeiten mit Stichpunkten gesucht werden können. Dort wird nicht nur auf einen Blick ersichtlich, wo die Arbeit veröffentlicht wurde, sondern auch, wie relevant die Arbeit gemessen an der Anzahl der Zitationen ist. Darüber hinaus sammelt Google Scholar alle bekannten Artikel von bestimmten Autor*innen auf einer separaten Seite.

Google Scholar model agnostic explainability methods 7 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
Beispielsuchanfrage bei Google Scholar. Metadaten, wie Veröffentlichungszeitraum und Art der Arbeit, können eingeschränkt werden. Unterstrichene Namen verlinken auf eine Autorenseite, auf der alle Arbeiten, welche Google Scholar bekannt sind, aufgelistet werden.

Neben modernen Tools wie Google Scholar bieten die Webseiten von renommierten Fachkonferenzen und Fachzeitschriften einen Index von vergangenen Veröffentlichungen an. Zur Einarbeitung in neue Themen bieten sich darüber hinaus Übersichtsartikel (sogenannte Surveys) an. Dort tragen Wissenschaftler*innen den aktuellen Stand der Wissenschaft zum Veröffentlichungszeitpunkt des Übersichtsartikels zusammen, ordnen die einzelnen Arbeiten in den größeren Kontext ein und diskutieren Vor- und Nachteile. Ebenso können aufgezeichnete Vorlesungen auf Youtube sowie Fachbücher helfen, wenn das Thema, in welches man sich einarbeiten möchte, fundamental und unspezifisch ist. Eine neue Lösung, um verwandte Literatur zu finden, bietet das kostenlose Tool Connected Papers. Dieses Tool visualisiert zu jeder gesuchten Arbeit einen Graphen, in welchem potenziell ähnliche Arbeiten nur wenige Knoten entfernt liegen. Wenn zwei Arbeiten tendenziell die gleiche Literatur referenzieren, dann liegen diese Arbeiten tendenziell näher im Graphen zusammen.

Connected Papers unified approach to interpretion model predictions 7 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
© Connected Papers (https://www.connectedpapers.com/)
Der von Connected Papers aufgebaute Graph visualisiert verwandte Arbeiten und koloriert diese nach Erscheinungsdatum. In den Randspalten erhalten die Benutzer*innen mehr Informationen und können, falls ein Account bei Connected Papers vorhanden ist, interessante Artikel für später abspeichern.

Wissenschaftliches Arbeiten heißt auch: Dem Papierdschungel Struktur geben

Heutzutage liegt Literatur meist in Form von PDF-Dokumenten vor. Obwohl einige Forscherinnen es bevorzugen, die Artikel auszudrucken, gibt es inzwischen sogenannte Bibliotheksmanager, welche die Organisation von Literatur erleichtern. Die zwei wohl populärsten Manager sind Mendeley und Zotero. Beide funktionieren nach folgendem Prinzip: Zu jeder Arbeit liegen Metadaten vor, etwa die Namen der Autorinnen, das Veröffentlichungsdatum sowie die Konferenz oder die Fachzeitschrift, in welcher der Artikel veröffentlicht wurde. Die Benutzer*innen des Bibliotheksmanagers können Literatur hinzufügen und die Manager ordnen die Arbeiten dann anhand dieser Metadaten ein und erlauben einfaches Sortieren und Filtern. Ebenso erlauben beide Manager, dass die zugehörigen PDF-Dokumente hinterlegt und synchronisiert werden. Dies erlaubt das Lesen und Annotieren des gleichen Dokuments sowohl auf dem PC als auch auf Smartphone und Tablet.

Zotero 7 - Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)
Literatureinträge im Bibliotheksmanager Zotero. Unten: wichtige Metadaten zu der veröffentlichten Arbeit. Oben: Eine sortier- und filterbare Liste aller gespeicherten Artikel mit ihrem Titel, den Namen der Autor*innen sowie dem Veröffentlichungsjahr.

Bei der konkreten Auseinandersetzung mit einem bestimmten Artikel hilft es vielen Wissenschaftlerinnen wichtige Textstellen zu markieren, Ideen und Gedanken an der Seite zu notieren und digitale Kommentare hinzuzufügen. Oft bedeuten hier unterschiedliche Farben unterschiedliche semantische Konzepte. Kernaussagen, auf die man sich später in der eigenen Arbeit beziehen möchte, werden beispielsweise gelb markiert, während der Forschende potenziell interessante Quellen, die in der Arbeit erwähnt werden, rot markiert. Dieses System kann beliebig komplex konzipiert werden. Allerdings ist es meist hilfreich, mit einer simplen Strategie zu beginnen und erst im Laufe der Zeit die Komplexität zu erhöhen. Denn ein oft unterschätzter Aspekt ist, dass solche Systeme oft zu aufwendig konzipiert werden, um sie rigoros zu befolgen. Das beste Organisationssystem ist hinfällig, wenn die Zeit oder Motivation der Forscherinnen das Befolgen des Systems nicht zulässt. Hier greift das bewährte KISS-Prinzip: Keep it simple and straightforward!

Von Selbstorganisation, Zeitmanagement und aufgeräumten Notizen

Für neue Forscher*innen stellt die Literaturarbeit durch die immens hohe Anzahl an vorhandenen Arbeiten zunächst oft eine große Hürde dar. Allerdings wird diese Aufgabe deutlich durch die heutzutage vorhandenen Tools sowie durch rigorose Organisationssysteme erleichtert. Am wichtigsten ist dabei, dass man den Fokus nicht verliert und Systeme, welche man selbst befolgen möchte, auch einhält. Um Konzepte für das Zeitmanagement sowie um das Konservieren von extrahiertem Wissen durch aufgeräumte Notizen soll es im nächsten Blogbeitrag der Serie gehen.

Matthias Jakobs

Matthias Jakobs beschäftigt sich in seiner Forschung intensiv mit vertrauenswürdigem maschinellen Lernen. Derzeit arbeitet er an verschiedenen Problemen, darunter die Bereitstellung von Garantien für Erklärungsmethoden, die auf Shapley-Werten basieren, sowohl in der Theorie als auch in der praktischen Anwendung. Zudem untersucht er die Kombination von Erklärbarkeitsmodellen mit Bayesschen Neuronalen Netzen (BNN). Sein besonderes Interesse gilt der Beleuchtung des Entscheidungsfindungsprozesses von Black-Box-Modellen. Ziel ist es, sowohl Nutzern als auch Experten mehr […]

Weitere Blogartikel