Die rasante Entwicklung von generativer Künstlichen Intelligenz verändert unsere Welt grundlegend. Mit dem Aufkommen immer leistungsfähiger Sprachmodelle (LLM) – jüngst GPT-4o – treten Frage zu ihrer Intelligenz immer stärker ins Zentrum der Debatte: Sind LLMs intelligent? (Wann) werden sie menschliche Intelligenz übertreffen? Und wie können wir überhaupt mit passenden Begriffen beschreiben, was generative KI (GenAI) „tut”?
Der kanadische Philosoph Marshall McLuhan entwickelte in den 1960er-Jahren eine Medientheorie, die heute noch so aktuell ist, dass sie einen hilfreichen Blickwinkel auf LLMs und generative KI eröffnet. Berühmt geworden ist er vor allem durch einen Satz: „The medium is the message“ – das Medium ist die Botschaft.
Ein Medium ist nach McLuhan eine Erweiterung oder Verringerung der menschlichen Sinne und Körper. Nicht der Inhalt eines Mediums (z. B. bei Büchern die Bibel oder Harry Potter) sondern wie das Medium die kulturelle, ästhetische oder soziale Ordnung umgestaltet, ist entscheidend. McLuhan sagt: „The ‚message‘ of any medium or technology is the change of scale or pace or pattern that it introduces into human affairs“ (z. Dt.: Die “Botschaft” eines jeden Mediums oder einer Technologie ist die Veränderung des Umfangs, des Tempos oder des Musters, die es in die menschlichen Dasein einführt).
Medien verändern unsere Welt – tiefgreifender als wir denken
Ob KI-Chatbots, das Fernsehen, oder der Buchdruck: Alle Medien oder Vehikel einer Technologie prägen und verändern die Erfahrungen ihrer Nutzer:innen und haben gesellschaftliche Folgen. Sie produzieren neue Handlungsstrukturen und verändern unser Verhalten. Der Buchdruck, zum Beispiel, verringerte die Bedeutung mündlicher Kommunikation und gemeinschaftlichen Erzählens. Gleichzeitig ermöglichte er uns, Informationen allein und unabhängig von Autoritäten zu lesen und zu verarbeiten. Das förderte individuelles Denken und Lernen, unabhängig von Institutionen wie der Kirche. Wissen konnte nun weit verbreitet und konserviert werden. Das allgemeine Bildungsniveau stieg rasant und setze gesellschaftliche Emanzipationsprozesse wie die Aufklärung in Gang.
Ein paar Jahrhunderte später steht in fast jedem Wohnzimmer ein Fernseher. Anders als der Buchdruck fördert das Fernsehen eine multisensorische Erfahrung und eine fragmentierte Wahrnehmung. Es erweitert sowohl den visuellen als auch den auditiven Sinn. Im Gegensatz zum linearen und sequenziellen Lesen eines Buches erfordert das Fernsehen eine simultane Verarbeitung von Bild, Ton und Bewegung. Gleichzeitig erfordert es weniger aktive Beteiligung und führt so zu einer passiveren Informationsaufnahme. Durch das Fernsehen wurde die Gesellschaft mehr auf visuelle und emotionale Inhalte fokussiert. Das verändert die Art und Weise, wie Informationen vermittelt und verstanden werden, weg von rein rationalen und textbasierten Medien hin zu emotionaleren und bildbasierten Medien. Fernsehen trägt so zur Bildung eines „Globalen Dorfes“ bei, in dem räumliche und zeitliche Grenzen durch mediale Vernetzung überwunden werden.
Und heute? Mit ChatGPT, Midjourney und Co. verfügen wir über völlig neue Medien. Sie sind Werkzeuge, mit denen sich Millionen Menschen bereits ihren Arbeitsalltag erleichtern. Mit 100 Millionen Nutzer:innen nach zwei Monaten stellte ChatGPT den Rekord für die am schnellsten wachsende Plattform auf. Diese Medien haben bereits zahlreiche Anwendungsbereich, vor allem in der Sprach- und Textverarbeitung. Unternehmen nutzen sie zum Beispiel im Marketing, Support und Vertrieb, um Textübersetzungen zu erstellen und automatisierte Antworten auf Kundenanfragen generieren. Unternehmen wie Geberit zeigen bereits eindrucksvoll, wie leistungsstark KI-Chatbots sein können.
Aber auch in der Medizin hilft KI durch Bild- und Objekterkennung bei der Diagnostik. Das KI-System AlphaFold, zum Beispiel, löste das Problem der Proteinfaltung, indem es die 3D-Struktur von Proteinen mit hoher Genauigkeit vorhersagt. Dadurch verstehen Wissenschaftler:innen Proteine noch besser und können schneller neue Therapien entwickeln. In der Automobilindustrie gewinnen Assistenzsysteme und autonomes Fahren an Bedeutung. Branchenübergreifend werden KI-Systeme in der Qualitätskontrolle und Fehlererkennung eingesetzt. Immer wichtiger wird KI auch im Bereich Bildung. Interaktive, maßgeschneiderte Lernbots verändern schon jetzt grundlegend, wie Menschen lernen.
Aber GenAI-Tools sind noch viel mehr: Als Medien und Vehikel einer neuen Technologie verändern und gestalten sie unsere Wirklichkeit – genau wie der Buchdruck, das Fernsehen und die vielen anderen Technologien und Medien, die Menschen erfunden haben. Sie beeinflussen, wie wir die Welt wahrnehmen und mit ihr interagieren. Diese Einflussnahme reicht von der Art und Weise, wie wir kommunizieren, bis hin zu dem, wie wir Entscheidungen treffen. Aber was bedeutet das konkret? Wird KI die Welt noch dramatischer verändern als das Fernsehen? Warum weckt KI so viel Interesse und erzeugt zugleich so viel Angst?
Was generative KI mit uns macht
Ähnlich wie der Buchdruck ermöglichen LLMs einen schnellen Zugang zu riesigen Mengen an Informationen und Wissen. Das verändert die Art und Weise, wie wir lernen und Wissen erlangen. Die erste Botschaft von KI lautet deshalb: Wir benötigen unsere Gehirne immer weniger zum Speichern von Faktenwissen und zum Verstehen komplexer Konzepte und Denkprozesse. Ein intelligenter Chatbot „weiß” unendlich viel mehr, kann sich alles merken und Inhalte sinnhaft ausgeben. Wichtiger für Menschen werden deshalb strategisches und prozedurales Wissen, also wie man Aufgaben durchführt und Probleme löst. Dieses Wissen ist entscheidend, um zu verstehen, wie man generative KI-Assistenten anleitet, um effizienter Aufgaben zu erledigen (z. B. durch effektives Prompting). Auch soziales und kontextuelles Wissen über Normen und menschliche Interaktionen sowie über Bedingungen, unter denen Ereignisse stattfinden, werden wichtiger. GenAI-Tools verstehen unsere soziale, kulturelle und physische Welt nämlich nicht wie wir, weil sie kein Bewusstsein und (noch) keinen Körper haben, um ihre Umwelt wahrzunehmen.
Die zweite Botschaft von GenAI betrifft neue Formen der sozialen und kreativen Interaktion. Chatbots und andere KI-gestützte Kommunikationsmittel verändern, wie wir miteinander und mit Maschinen interagieren. Sie erweitern unsere Kommunikationsfähigkeiten und schaffen neue Formen der Interaktion, die rund um die Uhr und in Echtzeit verfügbar sind. Sie fördern die globale Vernetzung und kulturelle Integration, z. B., indem Sprachbarrieren durch simultane Übersetzungstools verschwinden. Doch während sie die Erreichbarkeit und Effizienz verbessern, können diese Medien auch zur sozialen Isolation und Entfremdung führen. Der Mangel an physischer und emotionaler Präsenz in maschinellen Interaktionen kann das Gefühl der Verbundenheit verringern. Die Nuancen und Tiefen persönlicher Gespräche können verloren gehen, wenn Maschinen überall als Vermittler fungieren. GenAI-”Kreativität” verdrängt zutiefst menschliche, mühsame Auseinandersetzung mit der Welt und verändert so den Stellenwert des Konzepts Kreativität an sich.
Was bedeutet das alles für das Medium KI? Kurz gesagt: Bei generativer KI geht es vielleicht gar nicht so sehr um den einzelnen Inhalt, also den Output, den ein GenAI-Tool ausgibt. Viele Diskussionen hängen sich daran auf, dass generative KI entweder halluziniert und Mittelmäßigkeit produziert oder bereits kurz davorsteht, Menschen in allem zu übertrumpfen. Dabei verlieren diese Diskussionen die viel wichtigere Frage aus den Augen: Wie verändert sich unser Menschsein durch das Medium?
Denkmaschinen: Von Zettelkästen zu Neuronennetzen
Schon seit Jahrhunderten versuchen Menschen, Maschinen zu schaffen, die denken können. Von mechanischen Automaten bis hin zu komplexen Computerprogrammen: Das Ziel war immer, menschliche Denkprozesse nachzuahmen und zu erweitern. Umberto Eco, ein italienischer Philosoph und Schriftsteller, ging sogar so weit, Texte als Maschinen zu betrachten. Denn sie erzeugen verschiedene, neue Interpretationen und Gedanken, je nachdem, wer sie zu welchem Zeitpunkt und unter welchen Umständen liest. Kontexte, Erfahrungshorizonte, Bildungshintergründe und vieles mehr verändern den Blickwinkel und eröffnen so neue Deutungshorizonte eines Textes.
Neue Denkangebote kreiert auch der berühmte Zettelkasten des Soziologen Niklas Luhmann. Zwischen 1951 und 1997 füllte er diesen mit 90.000 Zetteln. Luhmann nutzte diesen Zettelkasten, der durch ein ausgeklügeltes Nummerierungs- und „Multiple storage“-Prinzip gekennzeichnet ist, um Themenvielfalt zu ermöglichen und den Kontext eines Themas durch verschiedene Verweisstrukturen zu erweitern. Er sah den Zettelkasten als Zweitgedächtnis und Denkwerkzeug, das zu einem diskursiven Partner in der Erzeugung von Wissen wurde. Luhmanns Methode ermöglichte es, durch das zufällige Ziehen und Verknüpfen von Zetteln neue Theorien und Ideen zu entwickeln. Anders gesagt: Durch die Arbeit mit dem Kasten konnten neue Gedanken entstehen, die ohne den Kasten so nicht entstanden wären.
Ganz ähnlich funktionieren neuronale Netze: Sie verknüpfen eine Vielzahl von Informationen in einer Weise, die zu neuen Einsichten und unerwarteten Lösungen führen kann, die vorab nicht erkennbar waren. Durch die komplexe Verknüpfung von Datenpunkten können diese Systeme Ergebnisse produzieren, die weder linear noch vorhersehbar sind (Emergenz). Sie agieren als kognitive Partner, um uns bei der Lösung komplexer Probleme zu unterstützen, indem sie uns helfen, Zusammenhänge zu erkennen, die wir allein vielleicht übersehen hätten.
Erzeugt KI Emergenz?
Können auch LLMs aktiv neue Gedanken generieren – also Emergenz erzeugen? Emergenz beschreibt Phänomene, die entstehen, wenn sich einzelne Teile zu einem größeren Ganzen zusammenfügen und dabei neue Eigenschaften entwickeln, die nicht vorhersehbar waren. In der Welt der KI tritt Emergenz auf, wenn Algorithmen beginnen, in Arten zu „denken“ und zu kommunizieren, die ihre menschlichen Schöpfer:innen nicht direkt vorgesehen hatten.
Forscher:innen von Google DeepMind haben eine mögliche Erklärung gefunden, wie KI-Systeme emergente Fähigkeiten entwickeln. Sie konnten mathematisch beweisen, dass KI-Systeme notwendigerweise ein kausales Modell der Daten und ihrer Zusammenhänge lernen müssen, um sich robust an veränderte Bedingungen anpassen zu können. Ändert sich die Verteilung der Daten, etwa wenn ein KI-Agent in eine neue Umgebung gesetzt wird, muss er seine Strategie mit minimalen Verlusten anpassen können. Je besser seine Anpassungsfähigkeit, desto genauer muss das implizit, nebenbei gelernte Kausalmodell sein.
Allerdings ist umstritten, ob die derzeitigen Methoden und Trainingsdaten dafür ausreichen und ob es sich bei den beobachteten Fähigkeiten um echte kausale Schlussfolgerungen handelt. Zwar kam ein anderes Forschungsteam jüngst zu dem Ergebnis, dass LLMs eine gewisse Fähigkeit zur Schlussfolgerung zu haben scheinen. Aber ohne einen richtigen Stresstest (z. B. mit kontrafaktischen Aufgaben) lässt sich nicht gesichert feststellen, dass sie auf eine allgemeine Art und Weise schlussfolgern. KI-Systeme scheinen sich eher auf ihre Trainingsdaten zu verlassen (approximate retrieval, z. Dt. ungefähres Abrufen), die sich nicht auf Aufgaben außerhalb der Verteilung verallgemeinern lassen.
Doch das muss nicht bedeuten, KI kann nicht beim Denken helfen. Wer kluge Fragen stellt und Prompts ausarbeitet, die ein LLM dazu bringen, komplexe inhaltliche Verknüpfungen zwischen Themen zu machen, kann genauso neue Gedanken erzeugen wie Luhmanns Zettelkasten sie produziert hat. Wer strategisches und kontextuales Wissen klug einsetzt, kann Szenarien erstellen, Bedingungen aufstellen und Rahmen setzen, um mit einem KI-System nützliche und kreative Outputs zu erzeugen.
Der Zauber steckt in den Daten
Denken wir zurück an die Ausgangsfrage: Mit welchen Begriffen können wir beschreiben, was KI macht? Wenn Intelligenz sowohl in biologischen als auch in künstlichen Systemen ein emergentes Phänomen ist, also aus den komplexen Interaktionen und Verbindungen zwischen den Komponenten entsteht, müssen wir genauer auf die Komponenten künstlicher Systeme blicken – nämlich Daten.
Daten sind notwendig, um KI-Systeme zu trainieren. Und nur mit einer großen Menge an Trainingsdaten können KI-Systeme wirklich gut werden. Das bedeutet, dass Daten mehr sind als nur Informationen. Sie sind die Grundlage, auf der KI lernt und Entscheidungen trifft. Ihre Qualität, Vielfalt und Repräsentativität sind entscheidend dafür, wie effektiv, sicher und produktiv eine KI funktioniert.
Erinnern wir uns an McLuhan, der sagte, dass Medien die Art und Weise, wie wir Informationen wahrnehmen, verändern. Was bedeutet das, wenn wir auch Daten als ein eigenes Medium verstehen? Welche Botschaft tragen sie?
Daten beeinflussen, wie eine KI die Welt „sieht“ und interpretiert. Aus diesem Blickwinkel wird KI selbst zur Botschaft. Sie repräsentiert den Übergang zu einer datengetriebenen, automatisierten Welt, in der menschliche und maschinelle Intelligenz verschmelzen. Ihre Existenz und Funktionsweise verändern unser Verständnis davon, was möglich ist. Indem KI zum Beispiel Arbeitsprozesse vereinfacht und automatisiert, verändert sie grundlegend, welche menschlichen Kompetenzen in unserer modernen Gesellschaft an Bedeutung verlieren, und welche künftig sogar wichtiger werden als ein Universitätsabschluss, wie eine Microsoftstudie zeigt:
- 66 Prozent der befragten Führungskräfte sagen, sie würden jemanden ohne KI-Kenntnisse nicht einstellen.
- 71 Prozent würden lieber weniger erfahrene Kandidat:innen mit KI-Kenntnissen einstellen als erfahrenere Kandidat:innen ohne diese.
- 77 Prozent der Führungskräfte wollen Talenten am Anfang ihrer Karriere mit KI größere Verantwortung übertragen.
- 69 Prozent der Befragten sagen, KI könnte ihnen helfen, schneller befördert zu werden.
- 79 Prozent erwarten, dass KI-Kenntnisse ihre Jobchancen erweitern werden.
Die Zahlen belegen eindrucksvoll: KI formt unsere Gesellschaft; sie ist mehr als ihre Inhalte. KI formt die Strukturen, die festlegen, wohin wir uns als Gesellschaft bewegen, was als Nächstes erschaffen wird, welche Weichen wie gestellt werden für die Zukunft, wo investiert wird und wo nicht, was gefördert wird und was nicht.
Was bedeutet das für uns?
Ich denke, die Diskussion über generative KI sollte sich weniger auf die unmittelbaren Inhalte und mehr auf die umfassenden Auswirkungen auf unsere Gesellschaft und unser Selbstverständnis konzentrieren. Marshall McLuhan zeigt uns, dass Medien unsere Sinne und Wahrnehmungen erweitern oder verringern. Generative KI erweitert unsere kognitiven Fähigkeiten und die Art und Weise, wie wir Informationen verarbeiten und kreativ tätig sind. Gleichzeitig stellt sie uns vor neue Herausforderungen: den Wert der Tiefe und Originalität kreativer Arbeit, die Qualität und Repräsentativität von Daten und die potenzielle soziale Isolation durch maschinelle Interaktionen. Generative KI ist eine transformative Kraft, die unser Denken und unsere Wahrnehmung grundlegend verändert und uns dazu anregt, unsere Rolle in dieser neuen Welt kritisch zu hinterfragen und aktiv zu gestalten. Ich lade deshalb alle, die mit und an KI arbeiten, herzlich ein, mit uns zusammen darüber nachzudenken. Welche Veränderungen wollen wir fördern und welche eher nicht? Auf welche Gefahren sollten wir stärker achten und hinweisen? Wo liegen die großen emanzipatorischen Chancen von KI? Lasst es uns gemeinsam herausfinden.