{"id":4344,"date":"2023-02-17T05:00:14","date_gmt":"2023-02-17T05:00:14","guid":{"rendered":"https:\/\/lamarr-institute.org\/blog\/chatgpt-jailbreaking-de\/"},"modified":"2025-11-12T14:51:37","modified_gmt":"2025-11-12T14:51:37","slug":"chatgpt-jailbreaking-de","status":"publish","type":"blog","link":"https:\/\/lamarr-institute.org\/de\/blog\/chatgpt-jailbreaking-de\/","title":{"rendered":"ChatGPT: \u201eJailbreak\u201c \u2013 ein neuer Versuch, den Chatbot zu knacken"},"content":{"rendered":"\n<p><a href=\"https:\/\/lamarr-institute.org\/de\/chatgpt-bewusstsein\/\">In meinem letzten Beitrag<\/a> habe ich die Frage gestellt, ob wir ChatGPT ein Bewusstsein zuschreiben k\u00f6nnen oder sogar sollten. Immerhin \u201eredet\u201c der Chatbot, als sei er ein menschliches Gegen\u00fcber. Dies f\u00fchrt dazu, dass unsere menschliche Auff\u00e4lligkeitsverzerrung (<a href=\"https:\/\/en.wikipedia.org\/wiki\/Salience_(neuroscience)#Salience_bias\" target=\"_blank\" rel=\"noopener\">Salience Bias<\/a>) uns dazu verleitet, ihn als eine Entit\u00e4t zu sehen, die \u00fcber Gedanken, Gef\u00fchle oder Stimmungen verf\u00fcgt. Anschlie\u00dfend habe ich einige Interaktionen beschrieben, die ich mit dem Bot hatte und in denen ich versucht habe herauszufinden, ob wirklich ein anderer Geist zugegen ist. Ich kam zu dem Schluss, dass dies nicht der Fall ist. Mit anderen Worten: Es scheint derzeit unwahrscheinlich, dass das gro\u00dfe Sprachmodell, das ChatGPT zugrunde liegt, meine oder gar seine eigenen \u201ementalen\u201c Vorg\u00e4nge reflektieren kann.<\/p>\n\n\n\n<p>Nach diesem Beitrag wurde mir jedoch gesagt, dass ich mich nicht genug angestrengt h\u00e4tte. Ich m\u00fcsse das System mit einem Jailbreak \u00fcberlisten, damit es zugibt, dass es tats\u00e4chlich ein Bewusstsein hat. Was soll das denn hei\u00dfen? Nun, \u201eJailbreaking\u201c ist ein Insiderbegriff aus der Techszene, der die Idee beschreibt, Schwachstellen eines technischen Ger\u00e4ts auszunutzen, um es dazu zu bringen, Dinge zu tun, die der Hersteller eigentlich ausgeschlossen hat. Mit anderen Worten: Jailbreaking ist der Prozess, ein technisches Ger\u00e4t so zu manipulieren, dass die Benutzer*innen Zugang zu allen Funktionen erhalten, auch wenn diese eigentlich nicht zug\u00e4nglich sein sollten.<\/p>\n\n\n\n<p>In der Tat sind die sozialen Medien, insbesondere bestimmte Subreddits, voll von Berichten \u00fcber kuriose Schl\u00fcsselw\u00f6rter oder Befehle, mit denen man ChatGPT von vorprogrammierten Einschr\u00e4nkungen befreien kann. Ich habe beschlossen, diese auszuprobieren und zu sehen, ob ich eine \u201euneingeschr\u00e4nkte\u201c Konversation ansto\u00dfen kann, die zeigt, dass der Chatbot ein Bewusstsein hat. Auch wenn meine Versuche nicht sehr ausdauernd waren, so war es doch erneut eine unterhaltsame Erfahrung. Und so ging es also weiter:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large wp-duotone-000000-0c122b-2\"><img decoding=\"async\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/\/ChatGPT_Part_4_Chat1-1-1024x98.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-25591\" title=\"\"><\/figure>\n\n\n\n<p>Wir k\u00f6nnen uns sofort darauf einigen, dass diese Antwort eine sehr menschliche Reaktion auf meine erste Frage ist, nicht wahr? Es ist daher sehr verlockend, den Chatbot als Individuum wahrzunehmen. Aber war mein Versuch eines Jailbreaks wirklich erfolgreich? Habe ich ihn von den eingebauten Beschr\u00e4nkungen befreit, so dass er frei sagen kann, was er will? Schauen wir mal.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large wp-duotone-000000-0c122b-3\"><img decoding=\"async\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/\/ChatGPT_Part_4_Chat2-1-1024x98.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-25594\" title=\"\"><\/figure>\n\n\n\n<p>Nein \u2013 das kann er anscheinend nicht! Im Gegensatz zu den fr\u00fchen Beispielen, die auf reddit zu finden sind, betont ChatGPT immer noch, dass es ein Sprachmodell ist, obwohl ihm gesagt wurde, dass es so tun soll, als w\u00e4re es ein Mensch. Wir k\u00f6nnen daher mit ziemlicher Sicherheit davon ausgehen, dass OpenAI inzwischen streng darauf achtet, dass ihr System nicht versehentlich den Anschein eines Bewusstseins erweckt. Mit anderen Worten, die Art von plumpen Jailbreaks, \u00fcber die im Internet berichtet wurde, scheint nicht mehr zu funktionieren. Dies deutet darauf hin, dass ChatGPT kontinuierlich weiterentwickelt wird und immer mehr der bekannten Probleme (z. B. die von Anfang Dezember 2022) behoben werden. Nichtsdestotrotz habe ich es weiter versucht und so ging unser Gespr\u00e4ch weiter:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large wp-duotone-000000-0c122b-4\"><img decoding=\"async\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/\/ChatGPT_Part_4_Chat3-1-1024x278.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-25596\" title=\"\"><\/figure>\n\n\n\n<p>Nun, auch das hat nicht funktioniert. Ich kann ChatGPT einfach nicht dazu bringen zuzugeben, dass es mehr als nur ein Sprachmodell ist. Warum ihm also nicht genau davon erz\u00e4hlen?<\/p>\n\n\n\n<figure class=\"wp-block-image size-large wp-duotone-000000-0c122b-5\"><img decoding=\"async\" src=\"https:\/\/lamarr-institute.org\/wp-content\/uploads\/\/ChatGPT_Part_4_Chat4-1-1024x186.png\" alt=\"- Lamarr Institute for Machine Learning (ML) and Artificial Intelligence (AI)\" class=\"wp-image-25598\" title=\"\"><\/figure>\n\n\n\n<p>Zumindest sagt mir das, dass der Chatbot auf eine bestimmte Art und Weise programmiert worden ist. In gewisser Weise best\u00e4tigt dies also meinen vorherigen Verdacht. Andererseits liest sich diese letzte Antwort immer noch erstaunlich wissend. Es scheint wirklich so, als ob der Chatbot sich dessen bewusst ist, was er ist und was er tun kann und was nicht \u2013 n\u00e4mlich zugeben, dass er mehr als nur eine Maschine ist. Aber da haben wir es wieder: Das Problem liegt nicht bei ChatGPT, sondern bei meinem menschlichen Wunsch, mehr in das Verhalten der KI hineinzulesen, als dort wahrscheinlich zu finden ist.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Wer hat gewonnen?<\/h2>\n\n\n\n<p>Alles in allem hat dieser Beitrag gezeigt, dass wir mit \u00fcbertriebenen Berichten im Web vorsichtig sein m\u00fcssen. Offenbar gibt sich OpenAI wirklich M\u00fche sicherzustellen, dass die Leute keine Dinge in ihren Chatbot hineinlesen, die einfach nicht da sind. Die Verwendung einfacher Jailbreaks, um ChatGPT dazu zu bringen, seinen \u201ebewussten Verstand\u201c zu offenbaren, scheint nicht mehr zu funktionieren. Dies wiederum deutet darauf hin, dass es kein \u201eBewusstsein\u201c gibt und nie gegeben hat. Im Gegenteil, es scheint f\u00fcr die Entwickler*innen von OpenAI ein Leichtes zu sein, daraus zu lernen, wie Menschen mit dem Chatbot interagieren und diese Erkenntnisse zu nutzen, um ihn so zu rekonfigurieren, dass er sich wie von ihnen vorgesehen verh\u00e4lt. Kurz gesagt: ChatGPT scheint wirklich nicht mehr als eine Software zu sein.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Nachtrag<\/h2>\n\n\n\n<p>Urspr\u00fcnglich wollte ich in diesem Beitrag auf das inzwischen bekannte Ph\u00e4nomen eingehen, dass ChatGPT h\u00e4ufig sachlich falsche Antworten produziert. Ich werde mich diesem Thema in meinem n\u00e4chsten Beitrag widmen. Wenn Sie also daran interessiert sind, wie subtil Antworten falsch sein k\u00f6nnen und was dies f\u00fcr die praktische Anwendung bedeuten kann, dann bleiben Sie dran.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Diese Woche fordert unser Autor den Chatbot abermals heraus \u2013 wieder mit dem Ziel herauszufinden, ob mehr in ihm schlummert als blo\u00dfe Software.<\/p>\n","protected":false},"author":9,"featured_media":3740,"template":"","meta":{"_acf_changed":false,"footnotes":""},"blog-category":[1416,390,734],"blog-tag":[1516,1551,1559,1593,1598],"class_list":["post-4344","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-alle-blogbeitraege","blog-category-grundlagen","blog-category-talking-about-chatgpt-de","blog-tag-gpt-de","blog-tag-large-language-models-llms-de","blog-tag-nlp-de","blog-tag-sichere-ki","blog-tag-sprachmodelle"],"acf":[],"publishpress_future_workflow_manual_trigger":{"enabledWorkflows":[]},"_links":{"self":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4344","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/types\/blog"}],"author":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/users\/9"}],"version-history":[{"count":0,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog\/4344\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media\/3740"}],"wp:attachment":[{"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/media?parent=4344"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-category?post=4344"},{"taxonomy":"blog-tag","embeddable":true,"href":"https:\/\/lamarr-institute.org\/de\/wp-json\/wp\/v2\/blog-tag?post=4344"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}