Wie werden KI-Texte kreativ?
Wie werden KI-Texte kreativ?

Wie werden KI-Texte kreativ?

Bild von Stable Diffusion

Diese Bachelorarbeit entstand im WiSe22/23 unter der Betreuung von Prof. Dr. Thomas Reinhardt, im Institut für Ethnologie an der LMU in München. Sie beschäftigt sich mit der Frage, wie KI-Texte kreativ werden. Mithilfe eines Kreativitätsprofils analysiere ich den KI-Text „Harry Potter and the Portrait of what looked like a Pile of Ash“. Alle Quellen befinden sich im PDF.

Inwiefern sind Künstliche Intelligenzen (KI) in der Lage, kreative Texte zu generieren? Innerhalb des Themas Kreativität und aufgrund dessen Mystifizierung ermittelt diese Bachelorarbeit, wie KI-Texte kreativ werden, am Beispiel von „Harry Potter and the Portrait of what looked like a large Pile of Ash”. Diese Arbeit betrachtet Kreativität als einen Prozess und fragt, wie sie entsteht.

Inhaltsverzeichnis

1. Einleitung

Hello, my name is Assistant, and I am a language model created by OpenAI. Today, we’re going to delve into the fascinating world of artificial intelligence and creativity. With the rise of AI-generated fiction, the question of just how creative these machines can truly be has never been more pressing. From OpenAI’s GPT-3 to Google’s AI Experiments, we’re seeing more and more examples of AI-generated texts that leave us wondering: Is this truly the work of a machine, or are we witnessing a new form of creativity? In this article, we’ll be examining one such example, „Harry Potter and the Portrait of what looked like a large Pile of Ash“, to explore the depths of AI’s creative capabilities. Through examining the process of how the text was generated, how creativity emerges, and what activities can and should be automated by AI, we’ll come to a deeper understanding of what it means for something to be truly creative.

Und damit herzlich Willkommen im digitalen Zeitalter. Der Gini ist aus der Flasche und wir können das Wunder der Textgeneratoren nicht mehr länger leugnen. Der vorgehende Absatz wurde von der Künstlichen Intelligenz ChatGPT generiert, ohne Plagiate und innerhalb von Sekunden. Wer es nicht glaubt, überzeugt sich selbst (OpenAI 2022). In dieser Arbeit kennzeichne ich alle Beiträge von ChatGPT in der Online-Version kursiv.

Inwiefern sind Künstliche Intelligenzen (KI) in der Lage, kreative Texte zu generieren? Innerhalb des Themas Kreativität und aufgrund dessen Mystifizierung ermittelt diese Bachelorarbeit, wie KI-Texte kreativ werden, am Beispiel von „Harry Potter and the Portrait of what looked like a large Pile of Ash”. Diese Arbeit betrachtet Kreativität als einen Prozess und fragt, wie sie entsteht. Die Frage, wie KI-Texte kreativ werden, steht also der Frage gegenüber, was Kreativität eigentlich ist, und beinhaltet zudem eine normative Komponente: Was bedeutet uns Kreativität? Also inwiefern sind KI-Texte kreativ und sollten sie kreativ genannt werden? Das Vorhaben soll mithilfe von folgendem Vorgehen untersucht werden: (I) Wie ist der Beispielstext entstanden? (II) Wie entsteht Kreativität? (III) Ist der KI-Text „Harry Potter and the Portrait of what looked like a Pile of Ash“ kreativ? (IV) Wie können kreative Arbeitsschritte optimiert werden und welche problematischen Entwicklungen gibt es bei der Externalisierung kreativer Arbeitsprozesse?

Das 2. Kapitel beschäftigt sich mit den Entstehungsbedingungen des Textes „Harry Potter and the Portrait of what looked like a large Pile of Ash“. Das 3. Kapitel öffnet das Feld der Kreativitätsforschung und legt mithilfe eines Kreativitätsprofils essenzielle Faktoren für Kreativität fest. Im 4. Kapitel werde ich den KI-Text „Harry Potter and the Portrait of what looked like a Pile of Ash” mithilfe des Kreativitätsprofils analysieren. Das 5. Kapitel gibt einen Ausblick; er beschäftigt sich einerseits im Rahmen der Kollaboration zwischen Menschen und Künstlichen Intelligenzen mit einigen Optimierungsmöglichkeiten im fiktiven Schreibprozess und betrachtet andererseits einige problematische Entwicklungen bei der Externalisierung kreativer Arbeitsprozess in Bezug auf Kreativität. Um Missverständnisse zu vermeiden, kläre ich im Begriffsverzeichnis meine Begriffe. Ziel der Bachelorarbeit ist es, eine Antwort auf die normative Frage zu finden, welche Tätigkeiten eines kreativen Prozesses von Menschen behalten und von künstlichen Intelligenzen übernommen werden sollten.

 2. Entstehungsbedingungen des Textes

2.1. Botnik Studios schreiben Texte mithilfe von KI

Wie ist der Text „Harry Potter and the Portrait of what looked like a large Pile of Ashe” entstanden? Botnik Studios sind eine Gemeinschaft von Schriftsteller*innen, die mithilfe von Technologie unterhaltsame Texte schreiben (Du Sautoy 2021, S. 282–283), unter anderem die sogenannte Cyborg Comedy „Harry Potter and what looked like a large Pile of Ash“. Einen Ausschnitt des KI-Textes lässt sich auf der Website von Botnik Studios lesen (Towsen et al. 2020); er bildet einen Teil einer ganzen Serie von Kapitel 1 bis 14, welche ebenfalls vollständig einsehbar sind. Der Inhalt lässt sich grob interpretieren: das Trio aus Harry, Hermine und Ron belauschen eine Konversation zwischen Todessern auf dem Schuldach von Hogwarts, als Voldemort erscheint und Harry sich die Augen aus dem Kopf reißt. Andere Leser*innen mögen den Inhalt des Kapitels anders zusammenfassen, je nachdem welche inhaltliche Punkte sie als wichtig erachten.

„The castle grounds snarled with a wave of magically magnified wind. The sky outside was a great black ceiling, which was full of blood. The only sounds drifting from Hagrid’s hut were the disdainful shrieks of his own furniture. Magic: it was something that Harry Potter thought was very good.” – So fängt das Kapitel 13 des Romans „Harry Potter and the Portrait of what looked like a large Pile of Ash” an. Dieser Ausschnitt kreiert eine äußerst schaurige Atmosphäre und induziert ein verblüffend konkretes Bild von Hagrids quietschenden Möbeln. Nach diesem unheimlichen Absatz folgt: „Leathery sheets of rain lashed at Harry’s ghost as he walked across the grounds toward the castle. Ron was standing there and doing a kind of frenzied tap dance. He saw Harry and immediately began to eat Hermione’s family.” Die vorhin mysteriöse Stimmung löst Botnik Studios durch einen Stilbruch auf. Während der kontextlose Stepptanz noch als ein Zittern in der Kälte interpretiert werden kann, beginnt der Charakter Ron Weasley des Weiteren ohne einen nachvollziehbaren Grund Kannibalismus. „Ron’s Ron shirt was just as bad as Ron himself” – Spätestens zu diesem Zeitpunkt verlieren die Leser*innen den roten Faden. Wenn nun Leser*innen aus der Kontextlosigkeit nicht die Ironie ziehen, verlieren sie schnell die Lust sowie die Konzentration für das Weiterlesen. Der Inhalt des Harry Potter Romans ist diffus und absurd; es bleibt der Leserschaft übrig, aus den zufällig-zusammengewürfelten Sätzen eine sinnvolle Bedeutung zu gewinnen oder eben die Fähigkeiten einer KI bezüglich des fiktiven Schreibens zu belächeln. Nichtsdestotrotz erklärte die britische Tageszeitung The Guardian diesen KI-Text als einen von zehn der unterhaltsamsten Dingen im Internet von 2017 (Wong 2017). Das Unternehmen Botnik wurde von Jamie Brew und Bob Mankoff 2016 ins Leben gerufen (Botnik Studios 2019). Für mehr Informationen habe ich ChatGPT konsultiert.

Botnik Studios is a technology and entertainment company that uses machine learning and artificial intelligence to create content, including text, music, and art. One of the products that Botnik Studios is known for is a tool that allows users to input a large amount of text, and then uses a predictive keyboard to generate new text based on patterns in the input.

The text „Harry Potter and the Portrait of what looked like a large pile of ash“ was likely generated by this tool, using a large dataset of Harry Potter books as input. The tool works by analyzing the patterns and structure of the input text, and then using that information to generate new text that follows the same patterns. This means that the resulting text will contain elements of the input text, but may also include novel combinations of words and phrases.

The amount of creativity contained in this text will depend on the quality and diversity of the input dataset, as well as the specific parameters and settings used in the generation process. In general, the use of machine learning and artificial intelligence can help to automate certain aspects of the creative process, but the resulting content will always be influenced by the data and algorithms used to generate it.

Das stimmt so (vgl. Botnik Studios 2019). Die Textproduktion bei Botnik Studios ist also eine Kollaboration zwischen einer Software und einem Menschen. Dabei wird eine sogenannte intelligente Tastatur verwendet; wie sie funktioniert, wird in den nächsten beiden Kapiteln erläutert. Darüber hinaus ist ChatGPT der Ansicht, dass KI kreativ sein können, abhängig von der Qualität, der Diversität sowie der Parameterstruktur der Daten. Damit werden wir uns im Folgenden noch beschäftigen.

2.2. Top-down- & Bottom-up-Programmierung

Inwiefern ist die Software von Botnik Studios eine KI und wie lässt sie sich klassifizieren? In diesem Kapitel erkläre ich die Grundzüge der Top-down- & Bottom-up-Programmierung und erläutere den Unterschied zwischen den klassischen Algorithmen sowie den künstlichen Intelligenzen.

Was ist ein Algorithmus? Ein Algorithmus ist eine Handlungsvorschrift für die Lösung eines spezifischen Problems. Diese Handlungsvorschrift (1) besteht aus eindeutigen sowie präzisen Anweisungen, (2) beschreibt ein Problem mit endlichem Vorgang, (3) besitzt eine Antwort für jeden Eingabewert und (4) verwendet im Idealfall den schnellst-möglichen Weg zur Lösung (Du Sautoy 2021, S. 55). Tatsächlich sind Algorithmen älter als Computer; schon im antiken Griechenland entwickelte Euklid einen mathematischen Rechenweg für die Ermittlung des größten gemeinsamen Teilers zweier Zahlen, um Primzahlen zu finden (Du Sautoy 2021, S. 54). Formuliert oder programmiert werden Algorithmen durch Wenn-dann-Sätze, die sich hintereinander verketten lassen. Beim klassischen, deterministischen Algorithmus müssen Mathematiker*innen oder Programmierer*innen die Fragen bzw. den Rechenweg im Voraus formulieren, um die Lösung eines Problems ausrechnen zu können (Du Sautoy 2021, S. 72–78). Diese Herangehensweise nennt man Top-down-Programmierung (Du Sautoy 2021, S. 72–78). Sie ist geeignet, um gut definierte Aufgaben zu erledigen. Würde man eine Bilderkennungssoftware top-down programmieren, müsste man einen Fragenkatalog für jeden Pixel eines Bildes in Relation zu allen anderen Pixeln entwickeln. Der Rechen- sowie Arbeitsaufwand wäre dafür zu groß. Darüber hinaus stößt der Top-down-Ansatz an Grenzen der Kreativität: Algorithmen eignen sich gut für Problemlösungen, doch Kunst oder etwa Ästhetik besitzen weder eine formulierbare Problemlösung noch ein konkretes Ziel (Du Sautoy 2021, S. 127; Boden 1990, S. 9). Das Erstellen eines Fragenkatalogs für Kunst wäre unmöglich, aufgrund der (fast) unendlichen Anzahl der Vorgänge, die vorprogrammiert werden müssten.

Im Vergleich zum klassischen Algorithmus ermittelt eine Künstliche Intelligenz die besten Fragen selbstständig (Du Sautoy 2021, S. 78–79). Während ein Algorithmus nur eine Art Rechenweg darstellt, beinhaltet eine KI eine Vielzahl an probabilistischen Algorithmen. Der Unterschied zwischen einem Algorithmus und einer KI liegt darin, dass eine KI mithilfe von Trainingsdaten lernen und Aufgaben selbstständig lösen kann, ohne dass jeder Schritt programmiert werden muss (Plattform Lernende Systeme 2022; Wuttke 2022). Die Herangehensweise, eine KI zu entwickeln und mit Unmengen an Trainingsdaten zu füttern, nennt man Bottom-up-Programmierung (Du Sautoy 2021, S. 72–83). Indem Programmierer*innen KI trainieren, passen KI die Gewichtung ihrer Parameter selbst an und erkennen gewissermaßen universelle Strukturen, zum Beispiel für die Unterscheidung des Inhalts eines Bildes von anderen (Du Sautoy 2021, S. 81). Sie definieren also selbstständig sowohl die Struktur des Fragenkatalogs als auch dessen Inhalt.

Bevor KI Aufgaben lösen, gibt es drei Möglichkeiten des sogenannten maschinellen Lernens, also wie KI mit Trainingsdaten gefüttert werden: (I) überwachtes Lernen, (II) unüberwachtes Lernen und (III) verstärkendes Lernen. (I) Beim überwachten Lernen werden KI mit einer unvollständigen Information konfrontiert, die sie vervollständigen müssen; im Nachhinein wird die Lösung für die Aufgabe aufgedeckt, und die KI lernen aus ihren Fehlern (Beuth et al. 2022; Paaß und Hecker 2021, S. 45; Plattform Lernende Systeme 2022). Für das überwachte Lernen gibt es zum Beispiel riesige Datenbanken von Bildern, die mit einer Beschreibung ausgezeichnet sind (vgl. Beuth et al. 2022). Die Methode des überwachten Lernens wird deshalb meist für Bilderkennungsprogramme verwendet. (II) Beim unüberwachten Lernen versucht eine KI in den Trainingsdaten selbstständig bestimmte Muster zu erkennen (Paaß und Hecker 2021, S. 46; Plattform Lernende Systeme 2022). Mögliche Trainingsdaten sind Internetforen, Enzyklopädien und Datenbanken für Literatur. Oft wird das unüberwachte Lernen für Text-Generatoren verwendet. (III) Das verstärkte Lernen oder Bestärkungslernen sei eine Methode, bei der Personen der KI positives oder negatives Feedback zum Output geben; die KI versucht sich dementsprechend zu orientieren, um das positive Feedback zu maximieren (Paaß und Hecker 2021, S. 47; Plattform Lernende Systeme 2022).

Der Bottom-up-Ansatz hat zur Folge, dass die KI eine Blackbox ist – der Lösungsweg einer KI ist für die Programmierer*innen nicht nachvollziehbar, denn die KI nimmt den zu-untersuchenden Inhalt ganz anders wahr. Während der Mensch eine Affinität besitzt in symbolischen Mustern zu denken (Du Sautoy 2021, S. 106), erkennt eine KI andere Muster mit statistischer Aussagekraft anhand von autonom-ausgesuchten Anhaltspunkten. Angesichts der Intransparenz des Lernprozesses einer KI und der begrenzten Möglichkeit des Menschen, einzugreifen, kann ein falsches Lernen zu sogenannten „Algorithmischen Halluzinationen“ führen (Du Sautoy 2021, S. 83–86). Manchmal gibt es für probabilistische Algorithmen optische Täuschungen, die zu einer Fehlinterpretation führen können. Nicht zuletzt nehmen Algorithmen Korrelationen als Kausalitäten wahr (Du Sautoy 2021, S. 98). Du Sautoy erzählt eine Anekdote eines Panzer-Erkennungsalgorithmus, der mit Fotographien von unterschiedlichen Panzern gefüttert wurde (Du Sautoy 2021, S. 99–100). Diese Fotos wurden allerdings bei guten Wetterbedingungen geschossen, weshalb der Algorithmus die falschen Schlüsse aus den Trainingsdaten zog und in der Praxis keine Panzer erkannte; stattdessen konnte er ohne Probleme Wetterphänomene voneinander differenzieren (Du Sautoy 2021, S. 99–100). Das No-Free-Lunch-Theorem besagt dabei, dass es keinen universellen Lernalgorithmus für alle Zwecke geben kann (Du Sautoy 2021, S. 101). Das heißt wiederum, dass der Mensch den Zweck vorgibt und das Ergebnis der KI überwachen muss.

Im Vergleich zu der Top-down-Methode lassen sich Bilderkennungssoftwares und Textgeneratoren leichter bottom-up-entwickeln, weil ein probabilistischer Algorithmus nicht auf menschliche Hilfe angewiesen ist und bei der Auswertung großer Datenmengen sinnvolle Schlüsse ziehen kann. Mithilfe einer KI ist es sogar möglich, menschliche Vorlieben sowie Abneigungen annäherungsweise zu bestimmen und als Code mit vielen Parametern abzuspeichern (Du Sautoy 2021, S. 93), um zum Beispiel Produkte zu erschaffen, die vom Menschen als Kunst erachtet werden können. Nichtsdestotrotz liegt eines der Hauptprobleme darin, dass die alleinige Verwendung von Bottom-up-Ansätzen für eine Künstliche Allgemeine Intelligenz sehr viel Zeit und Rechenkapazitäten in Anspruch nimmt; Erfolge in der Programmierung würden mit ausschließlich Bottom-up-Ansätzen nur langsam verzeichnet werden  (McLean 2018). Deshalb bildet zurzeit die Kombination aus Top-down & Bottom-up den effizientesten Ansatz der Programmierung.

Das Computerprogramm von Botnik Studios fällt in die Kategorie der probabilistischen Algorithmen sowie KI. Es wurde vermutlich im Rahmen des unüberwachten Lernens mit den Harry Potter Bänden von J. K. Rowling trainiert, damit es sich selbständig bestimmte Schreibmuster aneignet.

2.3. Probabilistisches Rhizom

Wie funktioniert die KI von Botnik Studios und wie entstehen Bedeutungen für einen geschriebenen Text? In diesem Kapitel beschreibe ich den allgemeinen Generierungsprozess von Bottom-up-programmierten, probabilistischen Algorithmen beim Erstellen von bedeutungsvollen Inhalten.

Um Bedeutungen von Wörtern zu erfassen, gab es in der Programmierungsgeschichte zuerst die Methode des Symbol-Grounding: sie legt für alle Wortsymbole eine Wissensdatenbank an, die die Symbole verankert sowie sinngemäß verknüpft (Paaß und Hecker 2021, S. 170). Angesichts der komplexen Bedeutungsvielfalt der symbolischen Sprache, schien sich die Methode nicht durchgesetzt zu haben (Paaß und Hecker 2021, S. 170). Stattdessen werden nun Begriffe innerhalb einer KI durch Vektoren dargestellt, indem jeder Begriff einen Embeddingvektor erhält (Paaß und Hecker 2021, S. 171–172). Jedes Wort, das in den Trainingsdaten einer KI auftaucht, wird in einem virtuellen Raum eingebettet. Die Wörter werden nach Ähnlichkeit sortiert, indem die Entfernung zwischen zwei Wörtern die statistische Wahrscheinlichkeit darstellt, mit der die beiden Wörter aufeinander folgen (Paaß und Hecker 2021, S. 172–173). Dabei braucht eine KI keine Grammatikregeln zu verstehen, denn das probabilistische Aufkommen von Wörtern in Relation zu anderen Wörtern verhindert automatisch eine willkürliche Satzstruktur. So sind zum Beispiel die Wörter „gehe“ und „gehen“ zwei unterschiedliche Einträge – die KI lernt, dass nach „ich“ das Verb „gehe“ folgt, und eben nicht das Verb „gehen“ (Kehlmann 2021, S. 17). Nun lässt sich der semantische Gehalt von Wörtern oder Sätzen dadurch vergleichen, dass ein geringerer Vektorabstand zwischen zwei Begriffspunkten eine ähnliche Bedeutung signalisiert (Paaß und Hecker 2021, S. 178–179). Würde man eine KI mit Trainingsdaten von Internet-Posts füttern, hätten die Wörter „Bundeskanzlerin“ und „Merkel“ oder „Putin“ und „Arschloch“ einen sehr ähnlichen Embeddingvektor (Paaß und Hecker 2021, S. 178–179). Eine sehr enge Relation zwischen zwei Begriffen repräsentiert oft eine Analogie (Paaß und Hecker 2021, S. 178–179). Folglich aber beunruhigend ist, dass eine KI gesellschaftliche Klischees oder Vorurteile unreflektiert übernimmt, so wie sie in den Trainingsdaten existieren. Daraus resultiert, dass zum Beispiel die Wörter „Frau“ mit „klein“ und „Mann“ mit „groß“ konnotiert werden (Paaß und Hecker 2021, S. 180).

Die Gesamtheit aller Wörter, die als Vektoren gespeichert wurden und die Wahrscheinlichkeiten für das nachfolgende Wort enthalten, gleicht einem Netzwerk. In dieser Arbeit referiere ich auf das Netzwerk als ein sogenanntes „probabilistisches Rhizom“.  Da die KI mit Daten aus dem Internet trainiert wird, ist das entstandene, probabilistische Rhizom eine Repräsentation der sozialen Realitäten der Künstler*innen sowie Konsument*innen zu dem Zeitpunkt der Abnahme der Trainingsdaten. Ob dieses probabilistische Rhizom mit dem Kulturbegriff von Clifford Geertz einhergeht – Kultur als „selbstgesponnenes Bedeutungsgewebe“ – wäre eine interessante Fragestellung, die im Rahmen dieser Arbeit nicht beantwortet werden kann (vgl. Heidemann 2019, S. 22–27).

Eine KI löst ihre Probleme also durch eine Wahrscheinlichkeitsabschätzung, sodass sie die Bedeutungen der Wörter nicht verstehen muss, sondern nur die Relation der Wörter zu anderen Wörtern (Kehlmann 2021, S. 9–16). Symbole und Gefühle zum Beispiel lassen sich nur sehr schwierig definieren, aber der Bottom-up-Ansatz umgeht dieses Problem, indem er Wortgruppen und Antworten verwendet, die dem symbolischen und emotionalen Feld entsprechen. So kann eine KI niemals verstehen, wie sich der Verlust einer Person anfühlt, doch weiß sie, wie sie darauf reagieren muss, auf Basis der Trainingsdaten (McLean 2018).

Was die KI eigentlich tut, lässt sich mithilfe des Gedankenexperiments des sogenannten Chinesischen Zimmers vom Philosophen John Searle visualisieren. Das Chinesische Zimmer ist ein Raum, in dem sich eine Person aufhält, die kein Chinesisch spricht, jedoch Fragen in chinesischer Sprache gestellt bekommt und anhand einer Anleitung versucht, eine passende Antwort zu formulieren (Wirtz 2021). Eine KI arbeitet im Grunde genommen ähnlich wie die Person im Chinesischen Zimmer.

Sowohl Google Suggest als auch die WhatsApp-Mittelkonsole der Tastatur sind Beispiele, in denen Wortvorschläge auf Basis der statistischen Relation zu den vorgehenden Wörtern gegeben werden. Der Harry Potter Text von Botnik Studios ist im Grunde genommen genau so entstanden. Botnik Studios nutzt eine intelligente Tastatur, die eine Auswahl bestimmter Folgewörter vorschlägt, die aus der statistischen Wahrscheinlichkeit zum vorgehenden Wort errechnet wurden. Diese KI-Vorschläge wurden dann durch Menschen angenommen.

3. Dimensionen der Kreativität

Kreativitätsforschung bildet ein weites Feld. Die Forschung fand dabei in mehreren Disziplinen Anklang. Seit der Mitte des 20. Jahrhunderts widmeten sich zuerst die Psychologie dem Thema der Kreativität; der Psychologe Joy Paul Guilford gilt als einer der ersten Kreativitätsforscher*innen, der mithilfe seiner Intelligenz-Modelle Kreativität als Konfiguration psychologischer Fähigkeiten betrachtete (Weisberg 2020, S. 43–44). Kurze Zeit später beschäftigten sich auch die zwei großen Disziplinen Philosophie und Informatik mit der Kreativität. Die Kognitionswissenschaft entwickelte sich zwischen den drei großen Disziplinen als interdisziplinäre Schnittstellenwissenschaft (Käde 2021, S. 222–223). Die Computational Creativity (CC) bildet außerdem ein sehr spannendes Forschungsfeld innerhalb der Informatik; CC als Computer-induzierte Kreativität gilt als die letzte Hürde der künstlichen Intelligenz (vgl. Veale und Cardoso 2019). Seit den 1960ern wuchs das Repertoire an Definitionen für den Begriff der Kreativität, denn jeder habe eine Meinung diesbezüglich (Kaufman und Sternberg 2019, S. 27).

Den Begriff der Kreativität umgibt eine gewisse Unschärfe. Etymologisch lässt sich „Kreativität“ vom lateinischen Verb „creare“ ableiten – „erschaffen, erzeugen“ (Käde 2021, S. 223). Kreativität wird oft analog zum Begriff Intelligenz verwendet. Intelligenz wird definiert einerseits als Fähigkeit, Zusammenhänge zu erkennen und zu lernen (analytische Komponente), und andererseits als Fähigkeit, Probleme zu lösen (konstruktive Komponente) (Käde 2021, S. 221). Die Grenzen zwischen Intelligenz & Kreativität verschwimmen (Käde 2021, S. 234). Bei der Betrachtung der Vielzahl an Definitionen und Modellen gibt es (noch) keinen objektiven und universellen Kreativitätsbegriff. Obgleich der Begriff Kreativität oft im Kontext einer bestimmten Domäne verwendet wird, wie zum Beispiel für Kunst, Sport oder Wissenschaft (Veale und Cardoso 2019, S. 1–2),  so gibt es Kreativität auch im Alltag und in anderen Disziplinen. Arthur Koestler ermittelt zum Beispiel drei Felder des Schöpferischen: Humor, Wissenschaft und Kunst (Koestler 1966, S. 17) – aber hat Kreativität nicht auch das Potential aus konventionellen Kategorien auszubrechen?

Um Missverständnisse zu beheben, verwende ich Graeme Ritchies Unterscheidung zwischen zwei Kreativitätsdefinitionen: erstens, die lose Interpretation von Kreativität (kreativL) bezieht sich auf Aktionen oder Objekte, die aus der gesellschaftlichen Perspektive von Natur aus als kreativ gelten, wie zum Beispiel das Dichten, die Fiktion, das Komponieren oder die Malkunst, aber zum Beispiel nicht auf das Programmieren. Zweitens, die strikte Interpretation (kreativS) inkludiert jedes Handeln von Akteur*innen und meint den Ausdruck des Grades einer kreativen Leistung oder Exzellenz (Veale und Cardoso 2019, S. 161–162). Obwohl diese Arbeit die Domäne der Fiktion untersucht, beschäftige ich mich zunächst mit dem strikten Kreativitätsbegriff, damit ich wichtige Domänen-übergreifende Elemente nicht ausschließe. In der Kreativitätsforschung gibt es nämlich unzählige Herangehensweisen sowie Vorschläge für die Definition des Begriffs, von denen ich nur einige im Folgenden anführen und diskutieren werde.

Für eine übersichtliche Struktur verwende ich das 4-P-System von Mel Rhodes: (1) Person, (2) Process, (3) Product, (4) Press (Rhodes 1961; Kaufman und Sternberg 2019, S. 28). Unter Personen verstehe ich die Künstler*innen, unter Produkt das jeweilige Objekt und unter der Presse die Konsument*innen des Objekts (siehe auch im Begriffsverzeichnis). Unter Kapitel (3.1.) untersuche ich die Eigenschaften sowie Fähigkeiten der Künstler*innen, unter (3.2.) den kreativen Schaffensprozess, unter (3.3.) das kreative Objekt und unter (3.4.) den Einfluss der Konsument*innen auf das Verständnis der Kreativität in der Gesellschaft. In Kapitel (3.5.) werde ich das Kreativitätsprofil erstellen.

3.1. Die kreativen Künstler*innen

In diesem Kapitel beschäftige ich mich mit Eigenschaften sowie Fähigkeiten der Künstler*innen, durch welche sie als kreativ bezeichnet werden und kreative Objekte erschaffen können. Dabei werde ich mich auf drei Eigenschaften beschränken.

Howard Gardner erstellt ein Portrait eines exemplarischen Kreators (examplary creator), indem er die historischen Genies Einstein, Picasso, Stravinsky, Eliot, Graham und Gandhi betrachtet und miteinander vergleicht (Gardner 1993). Interessant ist seine Analyse, dass kreative Individuen in mindestens fünf folgenden Aufgaben involviert gewesen sein müssen: (I) das Lösen eines Problems, (II) die Fortführung eines bestehenden konzeptuellen Themas, (III) das Erschaffen eines Objekts, (IV) eine bestimmte Vorstellung (stylized kind of performance) und (V) ein ausschlaggebendes Auftreten (performance for high stakes) (Gardner 1993, S. 373–374). Trotz allem ermittelt seine Analyse Korrelationen, keine Ursachen oder Bedingungen für Kreativität.

Miller hingegen ermittelt bestimmte „Markenzeichen“ für kreative Individuen: (1) Fähigkeit zur Introspektion, (2) Wissen über persönliche Stärken, (3) Ausdauer sowie keine Angst vor Fehlern, (4) Kollaboration & Konkurrenz, (5) das Klauen, Leihen sowie Verwenden von guten Ideen, (6) Ambiguitäten und (7) die Bereitschaft zu Leiden und oft zu scheitern (Miller 2020, S. 9–23). Nach Miller wäre eine KI demnach nicht kreativ, weil ihr eine reflexive Komponente fehlen würde, nämlich (1) & (2). Ob (1) & (2) programmierbar sind, ist fraglich. Millers Markenzeichen verwende ich für meine spätere Analyse.

Gardner würde der Introspektion (1) zustimmen; historische Genies haben die Tendenz sich sozial zu distanzieren und selbstbezogen zu sein (Gardner 1993, S. 369). Du Sautoy betrachtet die Akzeptanz des Scheiterns als eine wichtige Zutat für Kreativität (Du Sautoy 2021, S. 25) und würde dem Gesichtspunkt (3), (6) sowie (7) zustimmen. Seine Annahme lässt sich mit dem kreativen Prozess einer KI vereinbaren: Eine KI muss nämlich für das Erschaffen von Objekten sehr oft „scheitern“ und aus ihren Fehlern lernen, um ihre Parameter zu justieren. Ausdauer (3) trifft auch auf allgemeine Zustimmung (Newell et al. 1959; Veale und Cardoso 2019). Rogers gibt Beispiele zur Maximierung sowie Beförderung der Kreativität (Rogers 1954, S. 256); (4) Kollaboration & Konkurrenz funktioniert dabei parallel. Option (5) überschneidet sich mit der Investmenttheorie von Sternberg (Sternberg und Lubart 1995); diese wird später erläutert. Ambiguitäten (6) bestätigen Rogers, Ritchie und Gardner (Rogers 1954, S. 254; Veale und Cardoso 2019, S. 162; Gardner 1993, S. 361); Schweizer benennt Ambiguitäten als das Aushalten von simultanen konfligierenden Eindrücken mit dem Begriff der latenten Inhibition (LI) (Schweizer 2006, S. 165).

Tana S. Schweizer stellt das sogenannte Novelty Generation Model (NGM) vor, das den Kreativitätsprozess als unkonventionelles Denken anhand drei Faktorgruppen untersucht: (A) individuelle Motivation, (B) neurokognitive & persönliche Eigenschaften und (C) der Einfluss der sozialen Umwelt (Schweizer 2006, S. 164). Faktor (A) ist die Voraussetzung für die kreative Initiative. Unter Faktor (B) erwägt Schweizer einen beträchtlichen Einfluss insbesondere biologischer & angeborener Komponenten für die Erschaffung neuer Inhalte. Faktor (C) beinhaltet die Konsument*innen als Einflussfaktoren. Die Fähigkeit zur fokussierten Aufmerksamkeit sowie Defokussierung begünstigt den kreativen Prozess und sei zum Teil biologisch determiniert (Schweizer 2006, S. 165). Obwohl die biologische Prädestinationen einen großen Einfluss haben können, argumentiere ich mit Rogers, Ward und Weisberg, dass jeder Mensch fähig ist, kreativ zu handeln (Rogers 1954, S. 255; Weisberg 2020, S. 71; Kaufman und Sternberg 2019, S. 346). (A) beinhaltet (3) & (7) von Miller. (B) wird in dieser Arbeit nicht beleuchtet und auf (C) wird im Kapitel über die Konsument*innen eingegangen.

Anna Jordanous und Bill Keller siebten aus dreißig wissenschaftlichen Arbeiten 15 Komponenten von Kreativität heraus: (a) aktive Teilnahme & Durchhaltevermögen, (b) Umgang mit Ungewissheit, (c) domainspezifische Kompetenz, (d) generelles Intellekt, (e) Generierung von Ergebnissen, (f) Unabhängigkeit & Freiheit, (g) Intention & emotionales Involvement, (h) Originalität, (i) Progressivität & Entwicklung, (j) soziale Interaktion & Kommunikation, (k) Spontanität & unterbewusster Prozess, (l) Denken & Evaluation, (m) Wert, (n) Vielfalt und (o) Divergenz & Experimentieren (Miller 2020, S. 279). In Bezug auf die Domäne der Musik (also KreativitätL) habe die Komponente des Wertes nicht die höchste Priorität, sondern die Komponente der sozialen Interaktion & Kommunikation (Miller 2020, S. 280). Jordanous und Keller mischen bei ihrer Agglomeration Komponenten des Prozesses sowie des Produktes mit Elementen der Person, die von den Konsument*innen festgelegt wurden. Einige Komponenten lassen sich für die Beurteilung einer Person ausschließen; (e), (i), (j), (l), (o) gehören zum Prozess und (h), (m), (n) zum Objekt. (b) & (k) sind sehr spezifisch für bestimmte Domänen und nicht notwendig für einen kreativenS Prozess. (c) & (d) behandle ich unter dem Gesichtspunkt der kulturdeterminierten Wissenssystemen und des individuellen Einflusses. (f) ist eine normative Ansicht des Kreativen und wird im Fazit diskutiert. (a) & (g) werden im Folgenden verwendet.

Für die Ermittlung kreativerS Akteur*innen werde ich mich neben Millers Markenzeichen auf drei essenzielle Eigenschaften fokussieren, darunter die individuelle Motivation, die Intention & Ziele und der externe Einfluss. (a), (A) und (3) referieren auf die Motivation als eine initiierende Kraft für die Einleitung des kreativen Prozesses. Die Betrachtung der Intentionen von Künstler*innen entspringt (g). Der externe Einfluss darf ebenfalls nicht vernachlässigt werden und wird angesichts (c) & (d) beleuchtet. Der feine Unterschied zwischen Motivationen & Intentionen liegt darin, dass ersteres sich auf den Antrieb zur praktischen Umsetzung eines kreativen Prozesses bezieht und letzteres auf den spezifischen Grund oder auf den Inhalt des Kommunikationsbedürfnisses.

3.1.1. Individuelle Motivation

Aus der Motivation eines Menschen resultiert eine kreative Initiative. Kunst sei der Ausdruck des freien menschlichen Willens; der Wunsch, etwas zu erschaffen, existiere nur im Kopf des Menschen (Du Sautoy 2021, S. 111–112). Du Sautoy behauptet, eine Maschine habe keinen Mitteilungsdrang und keinen freien Willen. Einen freien Willen in eine KI einzuprogrammieren würde doch der Bedeutung des freien Willens widersprechen (Du Sautoy 2021, S. 297). Aber vielleicht sei der freie Wille ja auch eine Illusion (Du Sautoy 2021, S. 297). Carl Rogers sieht das Individuum als Mittelpunkt des kreativen Prozesses und erklärt, der Mensch habe ein natürliches Bedürfnis zur Kommunikation (Rogers 1954, S. 256). In gewisser Weise habe sogar das natürliche Handeln einer Person kreatives Potential (Rogers 1954, S. 255). Die Motivation für den Schöpfungsprozess zieht der Mensch aus der Tendenz zur Selbstverwirklichung (Rogers 1954, S. 251). KI reagiert zwar auf externe Einflüsse, doch besitzt (noch) keinen Drang zur Kommunikation, also keine Motivation per se.

3.1.2. Intention & Ziele

In der wissenschaftlichen Literatur spielen die Intention sowie die Ziele der Künstler*innen eine wichtige Rolle. Kreativität sei die relationale Beziehung zwischen einem Individuum und seinem Objekt (Rogers 1954, S. 250). Der kreative Prozess sei also das Erschaffen eines relationalen Produktes (Rogers 1954, S. 250). Neuheit ergebe sich aus der Beziehung und Interaktion zwischen dem Individuum und seinem Wissen (Rogers 1954, S. 250). So sei die Intention des Individuums, die sich in seinem Werk manifestiert, das ausschlaggebende Kriterium für Kreativität (Rogers 1954, S. 252–255). In anderen Worten, es ist der „Stempel des Individuums“, der den subjektiven Ausdruck umfasst; der Stempel bildet den essenziellen Faktor für den kreativen Schaffensprozess (Rogers 1954, S. 250). Intentionen & Ziele überschneiden sich; Ritchie unterscheidet zwischen schwachen Zielen als Teil der KreativitätL und starken Zielen der KreativitätS (Veale und Cardoso 2019, S. 164).

In der Programmierung von CC muss ein System für sich selbst denken, also Autonomität und eine Intention im Objekt widerspiegeln (Veale und Cardoso 2019, S. 50). Kunst habe im Allgemeinen eine Intention, Ästhetik und Botschaft inhärent; sie ist ein Produkt zur empathischen Verbindung des menschlichen Bewusstseins mit einem anderen (Du Sautoy 2021, S. 112–113). Miller definiert dabei die Intention, die Imagination sowie die Unberechenbarkeit als drei Qualitäten des kreativen Arbeitens (Miller 2020, S. 23).

Unter anderem experimentiert Simon Colton mit der künstlichen Erschaffung von Autonomität, Intention, Imagination sowie Anerkennung (appreciation) (Veale und Cardoso 2019, S. 51; Miller 2020, S. 125–127); der malende Narr (The Painting Fool) ist eine KI, die Portraits von Personen malt (Käde 2021, S. 247). Um den künstlerischen Output zu optimieren, besitzt die KI mehrere Schnittstellen zu Benutzer*innen und verwendet Trainingsdaten von Google, Flickr, Facebook sowie Twitter. Zudem lässt sich der malende Narr von der aktuellen Tageszeitschrift „The Guardian“ für die Stimmung des Bildes inspirieren. Des Weiteren berücksichtigt sie den Gesichtsausdruck der portraitierenden Person und wählt den Stil, das Material sowie die Farben autonom. Neben der Intentionalität fügt Colton einige weitere Komponenten hinzu für den kreativen Prozess: Lernen, Verantwortlichkeit, Innovation, Subjektivität und Reflexivität (Veale und Cardoso 2019, S. 171).

Im Vergleich zur Motivation können KI programmierte Intentionen sowie Ziele besitzen. Unklar ist, inwiefern KI eine Fähigkeit entwickeln können, eigene Intentionen zu entwickeln, weil sie dafür eventuell die Komponenten der Motivation brauchen.

3.1.3. Einflussfaktoren auf Künstler*innen

Nach Ward sei der Mensch in gewisser Weise sozial vorgeprägt; er habe eine strukturierte Imagination (structured imagination) und bediene sich dem Weg des geringsten Widerstands (path-of-least-resistance) für den kreativen Prozess (Kaufman und Sternberg 2019, S. 339–340). Ersteres seien die kulturell-determinierten Denkstrukturen & Kategorien, die das Individuum für die Konstruktion neuer Produkte verwendet. Letzteres beschreibt den individuellen Denkprozess des Individuums, der aus der Auswahl von Elementen aus den Denkstrukturen zusammensetzt. Eine Aufgabenstellung, die kreative Antworten fordert, beeinflusst dabei das Ergebnis (Kaufman und Sternberg 2019, S. 340). Ward ergänzt, dass der Konformitätseffekt (conformity effect) im kreativen Prozess eintritt, sobald Beispiele bei Aufgabenstellungen vorgezeigt werden (Sternberg und Kaufman 2018, S. 343). Das heißt, dass Individuen sich an den Beispielen orientieren, manchmal sogar dessen Fehler übernehmen und eine relativ kleine Reichweite von neuen Ideen aufweisen (Sternberg und Kaufman 2018, S. 343). Das Phänomen des Kopierens scheint unbewusst und größtenteils versehentlich zu geschehen (Sternberg und Kaufman 2018, S. 343–345). Je abstrakter der Einstieg für eine Aufgabenstellung oder je abstrakter die Anfangsbeispiele, desto origineller der Output (Sternberg und Kaufman 2018, S. 340). Menschen & KI müssen gleichermaßen im kreativen Schaffensprozess die gesellschaftlichen Prägungen annehmen; auf die Relevanz der Wissenssysteme wird später eingegangen.

3.2. Der kreative Schaffensprozess

In diesem Kapitel werden vier unterschiedliche Ebenen des kreativenS Prozesses betrachtet, darunter Denktypen, Prozessschritte, Qualitäten und die Umsetzung. Diese Ebenen widersprechen einander nicht, sondern ergänzen sich.

3.2.1. Unterschiedliche Typen des Denkens

Ashok Goel benennt unterschiedliche Denktypen: (1) das Design-Denken als Umgang mit offenen Problemen, nicht-präzise-formulierten Zielen und bestimmten Evalotionskriterien, (2) das systemische Denken als das Arrangieren von interaktiven Komponenten sowie kausalen Prozessen, (3) das Denken in Analogien als das Ergründen von Neuheiten sowie Ähnlichkeiten, (4) das visuelle Denken als die Vorstellungskraft, (5) das Abduktionsdenken als das progressive Erschließen von möglichen Erklärungen für bestimmte Probleme, (6) das Meta-Denken als das Reflektieren über das eigene Wissen (Veale und Cardoso 2019, S. 142). Diese Denktypen beziehen sich nicht auf psychologische Phänomene, sondern bilden analytische Kategorien der Wissensbearbeitung. Auch KI können im Sinne (2) denken, aber im Hinblick auf ChatGPT vermutlich auch (3), (4) und zum Teil (5). (1) & (6) erfordern Denkmuster, mit denen das bisherige Denken reflektiert und erweitert werden muss.

Goel fokussiert sich dabei nur auf (1) das Design des Systems; es umfasst unter anderem das Framen eines Problems, die Generierung von Ideen, die Evaluation und eine Reformulierung des Problems (Veale und Cardoso 2019, S. 141–142). Im Idealfall können alle Denktypen des kreativen Prozesses in der Fiktion verwendet werden. Insbesondere (3) das Analogiedenken sei essenziell für den kreativen Prozess (Veale und Cardoso 2019, S. 155). Diese Arbeit übernimmt diese Typen.

3.2.2. Prozessschritte

Wie lässt sich der kreative Prozess einteilen? Im optimalen Fall suche ich nach einem Modell, das sowohl für Menschen als auch für KI in Frage kommt und nicht nur die bloße Generierung von Ideen inkludiert.

Nach Campbell würden Ideen blind durch das Unterbewusstsein kreiert werden; man habe keinen direkten Einfluss auf sie (Sternberg und Kaufman 2018, S. 33). Diese romantische Vorstellung, dass Ideen AutorInnen nur so zufliegen können, versucht Henri Poincaré zu widerlegen. Der kreative Schaffensprozess beinhalte nach ihm einen bewussten Gedanken, der innerhalb eines unbewussten Gedankengangs bearbeitet wird, bis die Künstler*innen plötzlich illuminiert werden und ihre Idee verifizieren müssen (Miller 2020, S. 29–31; Boden 1990, S. 29–30). Beide Positionen sind ungenau und veraltet (vgl. Miller 2020, S. 29–31; Sternberg und Kaufman 2018, S. 33). Im Hinblick auf CC helfen sie leider nicht weiter.

Graham Wallas wiederum unterteilt den kreativen Prozess in fünf Schritten: (I) Phase der Vorbereitung, in der die Person Informationen sammelt, (II) die Inkubation, bei der die Person auch unterbewusst die Aufgabenstellung bearbeitet, (III) Phase der Andeutung (intimation), in der sich die Person dem Ziel nähert, (IV) die Illumination als erfolgreicher Durchbruch der Person und (V) die Verifikation, bei der die Person die Lösung testet sowie optimiert (Wallas 1926). Im Hinblick auf Maschinen, unterstreicht das fünf-Phasen-Modell von Wallas leider auch nicht die wichtigen Analyseschritte, weil KI einerseits keine psychologischen Phasen besitzen und andererseits eine heuristische Anleitung brauchen.

Michael D. Mumford vergleicht den kreativen Prozess mit der pragmatischen Herangehensweise, ein bestimmtes Problem zu lösen, und unterteilt ihn in acht Schritte: (1) Identifikation & Definition des Problems, (2) das Sammeln von Informationen, (3) die Organisation der Informationen, (4) die Kombination von Konzepten & Wissenssystemen, (5) die Generierung von Ideen durch heuristische Methoden, (6) die Evaluation der Ideen, (7) das Planen & Umsetzen und (8) die Überprüfung des Ergebnisses (Mumford et al. 2012, S. 42–43). Mumford fokussiert sich auf das Generieren von qualitativ-hochwertigen, originellen sowie eleganten Lösungen für komplexe Probleme; ich werde mich im Folgenden auf sein acht-Schritte-Modell beziehen (Mumford et al. 2012, S. 30). Diese acht Schritte können in der Reihenfolge variieren. Wie wir sehen werden, bezieht sich die Qualität des kreativenS Prozesses auf Schritt (4); an dieser Stelle kann der Schritt der Kombination von Elementen auch gegen andere Qualitätsformen ausgetauscht werden.

Mumford referiert mit Schritt (6) auf die sogenannte interne Evaluation einer Idee als fester Bestandteil des kreativen Prozesses, im Vergleich zur externen Evaluation des finalen Objekts durch Konsument*innen (vgl. Veale und Cardoso 2019, S. 166–167). Während die interne Evaluation der Künstler*innen darin besteht, die Idee zu manifestieren, so wird das Objekt in der externen Evaluation mit den vorgehenden Ideen sowie sozialen Konventionen verglichen (Veale und Cardoso 2019, S. 167). Die interne Evaluation umfasst einerseits den methodischen Überblick über die Chancen einer erfolgreichen Realisierung und andererseits die inhaltliche Überprüfung der Qualität sowie Originalität einer Idee, vor der exekutiven Durchführung. Sowohl Schritt (6) als auch (8) beschäftigen sich damit, ob die Idee oder das finale Objekt mit den Zielen & Intentionen der Problemidentifikation übereinstimmt. Auf die externe Evaluation wird später eingegangen.

An dieser Stelle definiere ich meinen eigenen Begriff: Unter dem sogenannten (kreativenS) „Impuls“ für den Schöpfungsprozess verstehe ich Schritt (1) als die Identifikation eines Problems, Schritt (6) als die Evaluation der Ideen und zuletzt Schritt (8) als das aktive Wahrnehmen eines kreativen Objekts. Der kreative Impuls wird von der Person durch die individuelle Motivation, Intentionen sowie Ziele getriggert. Er umfasst sowohl den ersten Schritt, das in Bewegung setzen, als auch die interne Evaluierung sowie das Abschließen eines kreativen Projekts. Dabei hat der kreative Impuls Überschneidungen mit dem Begriff des Handelns nach Hannah Arendt; Handeln sei die Fähigkeit der Menschen im öffentlichen Raum zusammen politische Felder zu eröffnen und Beschlüsse durchzusetzen (Arendt 2017), quasi einhergehend mit den drei ausgewählten Schritten des kreativen Prozesses. Die Menschen als KünstlerInnen sowie KonsumentInnen geben einem Ergebnis eine Bedeutung. Die Problemidentifikation ist sehr ähnlich zur internen Evaluation und zur Verifikation, weil bei den drei Vorgängen ein subjektiver Wert zugeschrieben wird. Während die KünstlerInnen in der Evaluation sowie Verifikation ein Objekt mit einer Bedeutung aufladen, erhält nämlich auch ein Problem erst durch seine subjektiv-wahrgenommene Relevanz einen Wert.

Arthur I. Miller versteht unter Kreativität, die Produktion von neuem Wissen durch bereits existierendes Wissen, mithilfe der Lösung von Problemen (Miller 2020, S. 5), sehr ähnlich zu Mumford. Herbert Simons Behauptung, dass kreative Objekte ausschließlich durch heuristische Methoden hergestellt werden können, ist falsch (Miller 2020, S. 271); Miller erkennt richtig, dass die Identifikation eines Problems Teil des kreativen Prozesses ist und den Heuristiken vorangeht, und zitiert Albert Einstein: „The formulation of a problem is often more essential than its solution […]” (Miller 2020, S. 6–9). Dies stimmt mit Mumfords Schritt (1) überein und gehört meines Erachtens zum kreativen Impuls. In einer Gegenüberstellung zwischen Computer und Menschen erkennen wir, dass Computer den kreativen Prozess mit einem Problem beginnen; Menschen starten jedoch mit dem Erkennen und Formulieren des Problems (Gardner 1993, S. 22). Auch Schweizer erkennt, dass der kreative Prozess des Individuums das aktive Suchen nach Neuem (novelty-seeking), das Finden von Neuem (novelty-finding) und die innovative Umsetzung (innovative performance) inkludiert (Schweizer 2006, S. 169). Letzteres bezieht sich auf Schritt (7) von Mumford.

Wichtig zu verstehe ist, dass die Lösung einer Aufgabenstellung sowie die Prozessschritte von Mumford abhängig sind von der (1) Problemidentifikation. Probleme lassen sich auf vielen Ebenen von Makro bis Mikro identifizieren. Das Makro-Ziel von Botnik-Studios ist Unterhaltung und dessen „Problem“ war KI in den Schreibprozess der Menschen zu humoristischen Zwecken zu integrieren. Das Problem der KI besteht auf Mikro-Ebene darin, lesbare sowie grammatikalisch-korrekte Sätze zu bilden. Beide Beispiele besitzen die gleichen Schritte, nicht jedoch denselben Inhalt. Während Botnik Studios die Idee einer Cyborg Comedy evaluierte, beinhaltet der Evaluationsprozess der KI keine Reflexion, falls er überhaupt existiert.

KI können innerhalb des systemischen Denkens (1) in einem bestimmten Aufgabenbereich Probleme identifizieren, (2) Informationen sammeln, (3) Informationen in bestehende Kategorien oder in das probabilistische Rhizom einbetten, (4) Daten je nach heuristischer Methode kombinieren und eventuell ergänzen, (5) deduktiv Lösungen für definierte Probleme finden, soweit die Lösung sich bereits im programmierten Möglichkeitsrahmen befindet, (6) Ideen nach bestehenden Kriterien evaluieren, (7) Lösungen planen sowie umsetzen und (8) mithilfe eines Durchschnitts oder Diskriminators bedingt überprüfen. Allerdings sind KI im Design-Denken, Abduktionsdenken oder Meta-Denken noch nicht fähig, neue Probleme zu erkennen und die Lösung mit einem statistischen Durchschnitt, oder nicht zuletzt auf ethische Weise, zu überprüfen. Den KI fehlt der kreative Impuls in vielen Aufgabenstellungen.

3.2.3. Qualität im kreativen Prozess

Mit Qualität bezeichne ich die kreative Höhe eines Prozesses, die sich im Objekt manifestiert. Die folgenden Modelle von Boden, Sternberg und Rogers aus der Theorie werden beleuchtet.

Boden differenziert drei konkrete Komplexitätsstufen der Kreativität: (A) Kombination, (B) Exploration und (C) Transformation. (A) Im Schaffensprozess ist die Kombination die einfachste, kreative Leistung; hier werden zwei bereits existierende Elemente verknüpft, um etwas Neues, Überraschendes sowie Wertvolles zu erschaffen (Du Sautoy 2021, S. 18–19; Boden 1990, S. 3). (B) Explorative Kreativität ist das Erforschen der Grenzen des Wissensschatzes sowie das Erweitern des Erfahrungshorizonts im Rahmen der kulturell-determinierten Realität (Du Sautoy 2021, S. 17–18; Boden 1990, S. 4–5). Im Vergleich zur Kombination werden neue, überraschende Elemente gefunden. (C) Die transformative Kreativität überwindet den Rahmen der kulturell-determinierten Realität und erschafft gewissermaßen eine Neue (Du Sautoy 2021, S. 19–20; Boden 1990, S. 5–6). Die Transformation charakterisiert sich oft durch den Bruch konventioneller Sichtweisen, durch einen Perspektivwechsel und die Aufhebung von Einschränkungen. Wiggins beschreibt Bodens kreative Transformation als eine Exploration auf Meta-Ebene (Veale und Cardoso 2019, 23–47). (A), (B) und (C) bestimmen die Qualität insbesondere des vierten Schritts von Mumford.

Das abstrakte, dreigliedrige Modell von Boden lässt sich folgendermaßen vorstellen: Wenn unsere kulturell-determinierte Realität eine zwei-dimensionale Fläche wäre, so würde die Kombination einzelne Punkte der menschlichen Erkenntnis neu verbinden, während die explorative Kreativität die hypothetischen Grenzen des Wissens erweitern würde. Die transformative Kreativität hingegen bricht aus dem zwei-dimensionalen Möglichkeitsraum (oder Fläche), reflektiert die kulturell-determinierte Realität und distanziert sich von der konventionellen Wahrnehmung; sie öffnet somit einen drei-dimensionalen Spielraum für neue, überraschende sowie wertvolle Ideen. Tony Veale und Amílcar F. Cardoso verwenden ähnliche Visualisierungsbeispiele (Veale und Cardoso 2019, S. 5–7).

KI können (A) Elemente miteinander verknüpfen und (B) Möglichkeitsräume erkunden. Die (C) Transformation ist eine Qualität der KreativitätS, die sich insbesondere in den Denktypen des Design-Denkens, des Abduktionsdenkens sowie des Meta-Denkens äußert. Eine KI ist (noch) nicht fähig, von sich aus eine Transformation als Exploration auf Meta-Ebene durchzuführen. Sind Meta-Ebenen als Möglichkeitsraum definiert, so lassen sich Transformationen vortäuschen; doch die Qualität der Transformation ist ja gerade das Potential eines unendlichen Regresses in einem bisher undefinierten Möglichkeitsraum.

Robert Sternberg entwickelte das Triangulationsmodell der Kreativität; nach ihm hängt eine kreative Leistung nämlich von drei Faktoren ab: (1) Überwindung der Gesellschaft, (2) Überwindung der eigenen Person, (3) Überwindung des Zeitgeists (Sternberg und Kaufman 2018, S. 318–330). Faktor (1) beinhalte die sozialen Konventionen zu hinterfragen und jenseits des gesellschaftlich akzeptierten Konsenses neue Elemente zu finden und zu debattieren. Faktor (2) sei das Überkommen der persönlichen Hürden und Hemmungen. Faktor (3) unterscheidet sich insofern von Faktor (1), dass grundlegende Werte sowie Kategorien der Wahrnehmung hinterfragt werden und eine neue Richtung eingeschlagen wird. Dies geschieht zum Beispiel durch eine interdisziplinäre Integration von Ideen. Durch die unterschiedlichen Kombinationen der Faktoren (1), (2) und (3) ergeben sich sieben Typen der Kreativität (Sternberg und Kaufman 2018, S. 324–328). Für die Arbeit sind jedoch nicht die sieben Typen, sondern die drei Faktoren der kreativen Leistung zielführend; der kreative Prozess bestünde aus dem bewussten Unterfangen einer Person einen bestimmten Erfahrungshorizont zu erweitern oder disruptiv zu sprengen. Doch leider ist erstens die Erweiterung des Wissens nicht notwendig für Kreativität und zweitens ist die Überwindung von Wissensstrukturen nicht hinreichend für ein vollständiges Kreativitätsmodell. Ganz im Gegenteil, Sternbergs Investmenttheorie der Kreativität schlägt sogar vor, dass Akteur*innen im kreativen Prozess wie in der Wirtschaft Ideen günstig einkaufen und teuer verkaufen müssen, ohne etwas zu überwinden (Sternberg und Lubart 1995; Sternberg und Kaufman 2018, S. 30). In dieser Theorie geht es um die Kombination, Verwendung und eine Re-Evaluation von einfachen Ideen zu einem bestimmten Zweck; sein Kreativitätsbegriff hat hier eine große Schnittmenge zur Innovativität. Bodens (A) könnte Sternbergs Investmenttheorie beherbergen; unter (B) fällt der Aspekt (2) von Sternberg und unter (C) ließe sich Aspekt (3) verstehen.

Arthur Miller unterscheidet zwischen Alltagskreativität (little c-creativity) und bahnbrechenden Entdeckungen (big-C creativity) (Miller 2020, S. 5; Käde 2021, S. 225–229). Somit sei Kreativität die Produktion neuen Wissens durch das Lösen von Problemen auf Basis bereits existierenden Wissens; dies schließt auch das Brechen von konventionellen Regeln mit ein (Miller 2020; Käde 2021). James Kaufman und Ronald Beghetto erweiterten die einfache Dichotomie zu einem 4-C-Modell, indem sie zwei Kategorien hinzufügen: professionelle Expertise (pro-C creativity) & transformatives Lernen (mini-c creativity) (Kaufman und Beghetto 2009, S. 1–12; Sternberg und Kaufman 2018, S. 346). Beide Modelle versuchen die Qualität der kreativen Schaffensprozesse in Kategorien aufzuteilen, indem sie kreative Produkte bewerten, doch ist die Nützlichkeit der Modelle fragwürdig, weil die vorgenommene Kategorisierung der kreativen Produkte höchst subjektiv ist. Muss ich für big-C Kreativität wirklich ein bestimmtes Alter haben oder einen Enzyklopädie-Eintrag besitzen oder einen Preis verliehen bekommen haben (vgl. Kaufman und Beghetto 2009, S. 2)? Dieses Modell ist für die Arbeit nicht weiter gewinnbringend.

Zuletzt betont Rogers die Konstruktivität der Kreativität, zu Gunsten des Individuums und der Gesellschaft; er schlägt dafür folgende Voraussetzungen vor: (I) Offenheit, (II) Fähigkeit zur (internen) Evaluation, (III) spielerische Fähigkeit (Rogers 1954, S. 252–255). Voraussetzung (I) umfasst eine Offenheit gegenüber dem „Fremden“ sowie die Sensibilisierung der Wahrnehmung (vgl. Rogers 1954, S. 254). Es ginge dabei zunächst nicht um die Bewertung der Umwelt, sondern um die Reflexion der Denkkategorien und die Entwicklung einer hohen Toleranz für Ambiguitäten (Rogers 1954, S. 254). Diese Offenheit stelle ich mir wie Spittlers „dichte Teilnahme“ vor (Spittler 2001). Voraussetzung (II) beschreibt die interne Evaluation als Ausdruck des Individuums; eine Person verleiht durch ihre Subjektivität und Intention einem Objekt die Kreativität (Rogers 1954, S. 254–255). Voraussetzung (III) sei die Fähigkeit mit Elementen, Perspektiven, Konventionen usw. zu spielen (Rogers 1954, S. 255). Rogers Voraussetzungen für Kreativität sind zwar vage, doch bilden sie grundlegende Strukturen für einen allgemeinen Konsens. Rogers Qualitäten eines konstruktiven Kreativitätsbegriff akzentuieren bestimmte Schritte von Mumford; mit (I) unterstreicht Rogers die Identifikation der Probleme, mit (II) die interne Evaluation und mit (III) die Kombination von Konzepten.

3.2.4. Umsetzung des kreativen Prozesses

Für die Erforschung des kreativen Prozesses führte Thomas B. Ward einige Experimente mit seinen Schüler*innen & Student*innen durch (Sternberg und Kaufman 2018, S. 335). Beim ersten Experiment sollten die Teilnehmer*innen eine neue Tier-Spezies auf einem anderen Planeten zeichnen (Sternberg und Kaufman 2018, S. 335–336). Das Ergebnis war erstaunlich – die Teilnehmer*innen verwendeten automatisch bekannte Wissensstrukturen für ihre Kreationen (Sternberg und Kaufman 2018, S. 338–339). Die neuen Tiere waren symmetrisch und setzten sich aus bekannten Kategorien von Körperteilen zusammen (Sternberg und Kaufman 2018, S. 335–336). Als die Teilnehmer*innen ein neues Tier kreieren sollten der gleichen Spezies, ließ sich eine Variation in Größe sowie Geschlecht feststellen (Sternberg und Kaufman 2018, S. 338–339). Das Verständnis von Kategorien dominierte den generativen Kreationsprozess, denn aus den Denkkategorien resultierte eine Verzerrung der Form – nicht etwa lenkte die Form die Funktionen oder Körperbausteine des Tieres (Sternberg und Kaufman 2018, S. 338–339). Beim zweiten Experiment testete Ward den Einfluss von bestimmten (Wissens)Konzepten auf die Anwendung der Denkkategorien, indem er die Teilnehmer*innen beauftragte ein neues Tier mit Federn zu erschaffen (Sternberg und Kaufman 2018, S. 339). Das Experiment bestätigte die Erwartungen – die Denkkategorien wurden im Zusammenhang theoretischer Strukturen eingebettet (Sternberg und Kaufman 2018, S. 339). Da Federn mit Fliegen assoziiert wurde, besaß das neue Tier Flügel. Im dritten Experiment beauftragte Ward seine Teilnehmer*innen, eine neue Sportart auszudenken (Sternberg und Kaufman 2018, S. 341). Je origineller sowie abstrakter die Ideen, desto schwieriger war die Sportart umsetzbar. Ward schließt daraus, dass eine regulierende Kraft im Schaffensprozess neue Ideen in einen realistischen sowie kohärenten Kontext setzen kann, sodass das Konzept der Kreativität in Abhängigkeit zum praktischen Nutzen befördert wird (Sternberg und Kaufman 2018, S. 341).

„Es ist alles erlaubt!“ ist ein schlechter Leitsatz für den kreativen Schaffensprozess (Boden 1995, S. 169). Keine Freiheit sei kein Widerspruch zur Kreativität (Boden 1995, S. 108). Ganz im Gegenteil, kreatives Denken bedarf immer bestimmten Regeln, also einschränkenden Bedingungen. Werden diese Regeln aufgehoben, ist das Resultat meist verwirrend (Boden 1995, S. 109). Künstler*innen sind im kreativen Schaffensprozess an eine kulturelle Grammatik gebunden (Boden 1995, S. 110–117). Ein Beispiel für eine Grammatik sei die Harmonielehre in der Musik (Boden 1995, S. 117). Longuet-Higgins scheint mit einem sehr mathematischen Ansatz und ohne musikalisches Feingefühl bestimmte Strukturen in der Musik gefunden zu haben; Töne werden durch Rhythmik & Tonalität verbunden (Longuet-Higgins 1987, S. 57–59). An dieser Stelle sei angemerkt, dass Kreativität sich oft mit Innovativität überschneidet, wobei letzteres nicht notwendigerweise Kreativität beinhalten muss. Mit Innovativität assoziiere ich im weiten Sinne die Umsetzung von praktischen Ideen, unabhängig von ihrer Neuheit.

Im menschlichen Gehirn lassen sich zwei konkurrierende Systeme identifizieren: Generator & Diskriminator. Ersteres ist eine exhibitionistische, progressive Kraft, die die Künstler*innen motiviert und drängt Kunst zu erschaffen. Letzteres ist eine immanente, beurteilende und hemmende Kraft, quasi ein innerer Zensor, der an Ideen zweifelt und den kreativen Output kritisiert. Während der dynamische Generator die Aufgabe übernimmt, Neuartiges sowie Überraschendes zu kreieren, besitzt der Diskriminator einen relativ statischen Charakter und beinhaltet die kulturell-determinierten Regeln für die Wert-Erschaffung (vgl. Du Sautoy 2021, S. 21). Der kreative Impuls besteht also einerseits aus der exhibitionistischen Kraft am Anfang des kreativen Prozesses anlässlich der Motivation der Künstler*innen, andererseits aus der beurteilenden Kraft am Ende, die die Ideen in Korrespondenz zum Ziel sowie zu bestehenden Denksystemen evaluiert und überprüft. Der Diskriminator befindet sich dabei in der internen Evaluation sowie im Schritt der finalen Überprüfung des kreativen Prozesses (vgl. Veale und Cardoso 2019, S. 166), aber auch in der externen Evaluation der Konsument*innen bei der Bewertung des finalen Objekts.

Ein gesundes Gleichgewicht zwischen Generator & Diskriminator gilt als produktiv und kreativitätsbefördernd. Ohne exhibitionistische Kraft gibt es keine Kreativität, und ohne Diskriminator entstehen wilde Ergebnisse, die zwar neu sowie überraschend sind, allerdings in den Augen der Konsument*innen meist nicht wertvoll erscheinen, auch wenn Künstler*innen in der Rolle der Konsument*innen dem Ergebnis einen bestimmten Wert zugestehen. Tommy McHugh erlitt 2001 einen Schlaganfall, woraufhin er den inneren Zensor verlor; nach seiner Genesung erfuhr er einen künstlerischen Erschaffungsdrang (Du Sautoy 2021, S. 138–140). Durch das Fehlen seines kritischen Egos bemalte und übermalte er immer wieder die Innenwände seines Hauses, obwohl er kein sonderbares Talent dafür besaß (Du Sautoy 2021, S. 138–140). Eine kreative Leistung nimmt immer Bezug auf den bereits bekannten Raum, der den Konsument*innen vertraute Orientierungspunkte gibt (Boden 1995, S. 110–111). Existiert eine Brücke zwischen dem konventionellen Denksystem und dem neuen Möglichkeitsraum, so werden Ideen nachvollziehbar (Boden 1995, S. 112). Ohne verbindende Strukturen stoßen neue Ideen bei den Konsument*innen meist auf Widerstand (Boden 1995, S. 111).

Ein perfekter Diskriminator verkörpert alle komplexen Komponenten des gesamten sozialen Kontextes. Doch die Programmierung eines solchen Diskriminators ist utopisch. Erstens, die Kultur ist stets im Wandel, weshalb auch die Normen & Konventionen dynamisch sind (Boden 1990, S. 10). Zweitens, eine vollständige Trennung zwischen Generator & Diskriminator ist praktisch unmöglich, weil der kreative Impuls des Generators von der Kultur beeinflusst wird und die kulturellen Regeln wiederum vom kreativen Output der Menschen geprägt werden. Die Herausforderung bei der Entwicklung einer KI liegt darin, dass sie den ästhetischen Wert für Kunst nicht objektiv quantifizieren kann (Boden 1990, S. 9). Hätte man einen vollständigen Diskriminator, dann hätte man ein Erfolgsrezept für kreative Objekte.

3.3. Das neue, überraschende, wertvolle Objekt

Für den weiteren Verlauf verwende ich die Kriterien von Boden, um ein kreatives Objekt zu bestimmen: (A) Neuartigkeit, (B) Überraschung, (C) Wert (Boden 1990, S. 1; Du Sautoy 2021, S. 11). (B) gilt als umstritten; Neuheit ist ein wichtiger Bestandteil von Überraschungen, weshalb (B) sich mit (A) überschneidet (Veale und Cardoso 2019, S. 169). Kurz: Eine Überraschung entstehe entweder durch einen außergewöhnlichen Gedanken oder durch eine Idee, die erst unmöglich schien, doch trotzdem möglich ist (Veale und Cardoso 2019, S. 169; Boden 1995). Obwohl Geraint A. Wiggins das Kriterium der Überraschung von Boden eher als eine emotionale Reaktion der Rezipient*innen identifiziert (Veale und Cardoso 2019, S. 25), werde ich meine Analyse des Kreativen nichtsdestotrotz durch den zweiten Gesichtspunkt ergänzen, weil der Überraschungsfaktor die Beschaffenheit eines kreativen Objekts meiner Meinung nach verbessert. Grundvoraussetzung für die Kreativität sei ein erschaffenes Produkt, also Objekt, das auf irgendeine Weise wahrnehmbar sei und sich in Wörtern, Kunst oder Erfindungen manifestiert hat (Rogers 1954, S. 250). Dieses Objekt müsse sich nicht auf einen Inhalt beschränken (Rogers 1954, S. 250), doch unterliegt es meistens als kreativesL Artefakt einer kulturell-determinierten Kategorie oder Domäne (vgl. Veale und Cardoso 2019, S. 163).

Tatsächlich sind sich alle Wissenschaftler*innen in der Kreativitätsforschung in einem Punkt einig: Neuheit ist ein essenzielles Kriterium für Kreativität. Doch was ist eigentlich neu oder originell? Margaret A. Boden differenziert zwischen der psychologischen und der historischen Kreativität (P- & H-Kreativität) (Du Sautoy 2021, S. 24; Boden 1990, S. 2). Ersteres fokussiert sich auf die Neuartigkeit, letzteres auf die Erstmaligkeit eines Objekts. Kreative Objekte können nur bedingt historisch kreativ sein, weil sie in gewisser Weise immer von vorliegenden historischen Ereignissen abhängen (Boden 1995, S. 47–51). In der Praxis ist deshalb eine Unterscheidung zwischen Neuartigkeit sowie Erstmaligkeit unmöglich, denn Künstler*innen sind sich meist unbewusst darüber, welche Vorstellungen sie sich aus der Umwelt aneignen (Boden 1995, S. 54). Auch im Hinblick auf die Parallelität der Erfindungsprozesse in unterschiedlichen Gesellschaften lässt sich eine Unterscheidung zwischen Neuartigkeit sowie absoluter Erstmaligkeit schwierig beurteilen (Veale und Cardoso 2019, S. 22).

Ist Neuheit (novelty) objektiv bestimmbar (Weisberg 2020, S. 53)? Das Creativity Implication Network (CIN) ist ein Algorithmus, der die Kreativität von Kunstwerken in Form von Gemälden und Skulpturen quantifiziert (Elgammal und Saleh 2015). Der Algorithmus verwendet hierbei einen engen Kreativitätsbegriff, der sich an der Originalität und dem historischen Einfluss der Werke orientiert (Elgammal und Saleh 2015, S. 2). Er wurde mit 62.000 Werken aus Kunstarchiven, wie Artchive sowie Wikiart.org, und mithilfe von Objektkategorien trainiert (Elgammal und Saleh 2015, S. 11–12). So zieht CIN artistische Konzepte, unter anderem Farbe, Ton, Stil, Texturen, Kontrast, Muster, Technik, Formen, Elemente, Bewegung, Vielfalt, Thema der künstlerischen Objekte für die Analyse in Betracht (Elgammal und Saleh 2015, S. 1–2). Im Anschluss errechnet das CIN einen Kreativitätsscore für jedes Kunstwerk aus (Elgammal und Saleh 2015, S. 12).

Das Ergebnis ist faszinierend – jedes Gemälde aus dem 15. bis zum 21. Jahrhundert ist entlang eines Zeitstrahls sortiert; die y-Achse des Graphen notiert dabei den Kreativitätsscore (Elgammal und Saleh 2015, S. 14–18). Die Mona Lisa von Leonardo da Vinci und der Schrei (1893) von Edvard Munch wurden als ikonische Gemälde mit dem höchsten Kreativitätsscore ausgezeichnet, nicht unverdient, denn sie wurden in der Kunsthistorie sehr oft rezitiert (Elgammal und Saleh 2015, S. 12). Gemälde mit hohem Score signalisieren oft den Anfang einer Kunstströmung, wie zum Beispiel Pablo Picassos „Ladies of Avignon“ (1907) den Kubismus anführt (vgl. Elgammal und Saleh 2015, S. 12–14). Besonders beeindruckend sei die Fähigkeit des Algorithmus Gemälde mit einer falschen Zeit-Anmerkung zu erkennen (Elgammal und Saleh 2015, S. 13). Das Gemälde „Composition en blanc, rouge et jaune“ (1936) von Piet Mondrian wurde zum Beispiel versehentlich mit der Jahreszahl 1910 beschriftet; durch den ungewöhnlich hohen Kreativitätsscore zu der Zeit, ließe sich der Fehler leicht auffinden und auf das Jahr 1936 korrigieren (Elgammal und Saleh 2015, S. 13).

Im sogenannte Zeitmaschinen-Experiment von Elgammal und Saleh rechnet das CIN den spezifischen Gewinn sowie Verlust des Kreativitätsscore für jedes Gemälde aus, bei der relativen Verschiebung der Werke auf dem Zeitstrahl in Richtung Vergangenheit sowie Zukunft (Elgammal und Saleh 2015, S. 19–21). Das Experiment zeigt, dass Kunstwerke in ihrer relativen Vergangenheit einen höheren Score hätten und in ihrer relativen Zukunft einen niedrigeren Score bekommen würden (Elgammal und Saleh 2015, S. 19). Des Weiteren gäbe es in den Strömungen des Impressionismus, Post-Impressionismus, Expressionismus sowie Kubismus die größte Änderungsamplitude des Kreativitätsscore, d.h. dass Werke in diesen Strömungen besonders revolutionär, neu sowie avant-garde waren (Elgammal und Saleh 2015, S. 20–21). Dem gegenüber stehen die Kunstwerke aus den Strömungen der Neoklassik sowie der Romantik, die eine niedrige Änderungsamplitude besitzen, nicht zuletzt, weil sie sich auf Kunstideale der Renaissance, Gotik sowie Mittelalter beziehen (Elgammal und Saleh 2015, S. 20–21). In gewisser Weise lässt sich seit dem 19. bis 21. Jahrhundert ein stetiges Wachstum an Neuheit und/oder Kreativität im Allgemeinen feststellen. Die Akzeleration der Herstellung von Neuem resultiert aus dem Individualismus, Deliberation des Marktes und der zunehmenden Komplexität.

Neuheit ist relativ, denn sie ist abhängig von (1) psychologischen Faktoren bei der Wahrnehmung, (2) der Evaluation der Konsument*innen und (3) bestehenden Denkstrukturen. (1) & (2) & (3) bilden eine Art Filter für die Neuheit: erst müssen Reize der Umwelt wahrgenommen, dann bewertet werden, im Hinblick auf die Denkstrukturen, damit ein Objekt den Neuheitscharakter besitzt. (1) & (2) & (3) sind eng miteinander verbunden und bauen aufeinander auf.

(1) Die Wahrnehmung von Reizen bilden die psychologischen Faktoren. Daniel E. Berlyne unterscheidet zwischen Dimensionen und Graden der Neuheit (novelty) (Berlyne 1960). Einerseits differenziert er zwischen neuen Erfahrungen, die noch niemals wahrgenommen wurden (absolute novel), und neuen Erfahrungen, die aus der Kombination von bekannten Elementen bestehen (relatively novel) (Berlyne 1960, S. 19) – kongruent zur H- & P-Kreativität Bodens. Andererseits bezieht sich Neuheit auf eine zeitliche Komponente; Berlyne differenziert zwischen totaler Neuheit in Bezug auf das Erfahrene (complete novelty), kürzlich erfahrene Neuheit (short-term novelty) und Neuheit im Sinne einer Begegnung von bekannten Gedanken nach einem längeren Zeitraum (long-term novelty) (Berlyne 1960, S. 19). Der Grad der Neuheit hängt also sowohl von der Häufigkeit des Auftretens eines Reizes ab, nach der Wahrnehmung der Relevanz des Reizes, als auch von der zeitlichen Wahrnehmung der Erfahrung und dem Grad der Ähnlichkeit zu bereits bekannten Reizen (Berlyne 1960, S. 22). Doch was gilt als relevant und wie lässt sich Relevanz ermitteln? Die Relevanz von wahrgenommen Reizen hängt simultan sowohl von der Evaluation der Konsument*innen als auch von bestehenden Denkstrukturen ab.

(2) Neuheit im Allgemeinen unterliegt dem Urteil der Konsument*innen, die festlegen, was ihrer Meinung nach relevant ist. Als Konsument*innen meine ich die soziale Dimension bestimmter Akteur*innen, die ein Objekt konsumieren und darauf reagieren. (Auch Künstler*innen können als Konsument*innen ihre eigenen Objekte konsumieren.) Elgammal und Saleh können Neuheit also mithilfe des CIN-Algorithmus tatsächlich objektiv darstellen, indem sie die Ähnlichkeit historischer Werke algorithmisch errechnen, weil die diesbezüglich definierte gesellschaftliche Relevanz den künstlerischen Werken schon inhärent ist. Die Kunstwerke, mit denen der Algorithmus trainiert wurde, unterliegen einer subjektiven Selektion der Gesellschaft, die zur Zeit des Werkes lebte. Vielleicht lebten im Mittelalter schon Künstler*innen, die den Dadaismus praktizierten; doch ihre Werke wurden nicht überliefert, weil sie im sozialen Kontext nicht als Kunst identifiziert wurden.

(3) Auch wenn Reize absolut oder komplett neu sind, müssen sie Anschluss an bestehende Denkstrukturen finden. Für die Wahrnehmung und Würdigung eines neuen Objekts muss es in einem bestimmten Verhältnis zum vorausgehenden Objekt stehen (Boden 1995, S. 83). Nicht nur besitzt Neuheit viele Eigenschaften bereits existierender Entitäten und bedarf deshalb viel (Vor)Wissen, auch ist sie abhängig von kultur-determinierten Konventionen, Werten und Paradigmen (Berlyne 1960, S. 19; Kaufman und Sternberg 2019, S. 340; Boden 1995, S. 50–51). Ein Synonym zur Neuheit sei die Unähnlichkeit eines Objekts zu seinen vorausgehenden (Veale und Cardoso 2019, 172ff.). Eine interessante Frage wäre, ob wir überhaupt neue Objekte wahrnehmen können, die keinen Bezug zu unserer konkreten Realität haben; diese Frage würde ich mit „nein“ beantworten, unter dem Gesichtspunkt, dass uns unsere kulturelle Prägung nicht bewusst ist.

An dieser Stelle scheint es uns intuitiv, dass ein kreatives Objekt eine Kombination aus Neuem und Wertvollem ist, wobei der Wert von den Konsument*innen erörtert wird, im Hinblick auf die Effektivität oder die Zweckmäßigkeit des Produktes. Dies besagt auch die sogenannte Standarddefinition der Kreativität – ein allgemeiner Konsens der meisten Wissenschaftler*innen (Weisberg 2020, S. 43–44; Käde 2021, S. 224). Das „Handbuch für Zeitreisende“ von Passig & Scholz (2020) zeigt mithilfe einer Selektion von historischen Ereignissen, dass revolutionäre Erfindungen immer an den Zeitgeist gebunden sind. Das heißt, dass die Bedeutung einer Idee als kreativ immer abhängig von der Verwendbarkeit, der Herstellbarkeit und den Bedürfnissen der Gesellschaft ist. Angenommen, wir würden ein Smartphone zurück in die Zeit des antiken Griechenlands schicken, so wäre der technologische Gegenstand nicht kreativ für die antike Gesellschaft. Es fehle die Elektrizität, das Funknetz, das Internet, die Materialien zur Herstellung; nicht zuletzt hätte das Smartphone keine nützliche Funktion für die damaligen Herausforderungen. Ob historische oder psychologische Kreativität – der kreative Vorgang muss insofern nachvollziehbar sein, dass der Bezug zum Vorherigen sich im neuen Objekt widerspiegelt. Auch in optischer Hinsicht – nicht ohne Grund hatte das erste Auto in den 1830ern erstaunliche Ähnlichkeiten mit einer Pferdekutsche (Kaufman und Sternberg 2019, S. 342). Da sich das wertvolle Element im kreativen Objekt schwierig definieren lässt und es diesbezüglich oft Uneinstimmigkeiten im Evaluationsprozess gibt, verzichten einige Wissenschaftler*innen auf die Variable des subjektiven Werts (Weisberg 2020, S. 46–51).

Algorithmisch lassen sich (A) Neuheit & (B) Überraschung einfach produzieren, doch eine ungewöhnliche Kombination mit einer statistische Überraschungsquote sind nicht hinreichend für ein kreatives Objekt; es bedarf immer den Bezug zur sozialen Realität (vgl. Boden 1995, S. 45–46). Nur manchmal lässt sich der Wert eines Objekts direkt und eindeutig ermitteln. Ein objektives Maß der Wertung ist zum Beispiel das Ziel, ein bestimmtes Spiel zu gewinnen (Du Sautoy 2021, S. 49). Ein Schachcomputer ist fähig bei den zahlreichen Möglichkeiten einen neuen sowie überraschenden Zug zu finden, der insofern wertvoll ist, dass er die Aussichten auf einen Gewinn maximiert. Doch in vielen Bereichen, wie zum Beispiel in der Fiktion oder in der Kunst gibt es kein eindeutig-definierbares Ziel, das das Wertvolle objektiv definieren könnte.

Newell, Shaw und Simon verwenden vier Kriterien, um eine Antwort auf eine Frage als kreativ zu identifizieren. Erstens, eine Antwort müsse neuartig und gewinnbringend für ein Individuum oder eine Gesellschaft sein; zweitens, sie müsse eine vorher-akzeptierte Idee widerlegen; drittens, sie resultiere aus der Motivation sowie einem Durchhaltevermögen; und viertens, die Antwort müsse ein Problem konkretisieren, das davor nur vage formuliert war (Gruber et al. 1964; Newell et al. 1959; Veale und Cardoso 2019, S. 3). Der erste Punkt bestätigt zwei Kriterien von Boden. Der zweite Punkt unterstreicht den Bezug zum vorgehenden Kontext. Der dritte Punkt bezieht sich auf die persönliche Eigenschaft. Der vierte Punkt geht mit der Ausrichtung der Problemidentifizierung nach Mumford einher und präzisiert den Inhalt von Makro auf Mikro. Das Konkretisieren eines Problems und anschließend die Erarbeitung von sensiblen Lösungen sehe ich als eine positive Tendenz einer Gesellschaft, im Hinblick auf die zunehmende Komplexität.

3.4. Die KonsumentInnen des Objekts

In diesem Kapitel geht es einerseits um das Bedürfnis der Gesellschaft nach Kreativität und andererseits um die externe Evaluation eines Objekts.

3.4.1. Kreativität als Bedürfnis der Gesellschaft

Ob die Manifestation im Objekt oder der Prozess – Kreativität ist ein natürliches Phänomen des Menschen. Gesellschaften entwickeln sich progressiv im Laufe der Zeit, dadurch, dass sie Herausforderungen erkennen und kreative Lösungen erarbeiten. Nicht zuletzt befördern der Individualismus, Liberalismus und Kapitalismus den menschlichen Schaffensgeist durch Konkurrenz und neue Bedürfnisse, wie der Drang zur Selbstentfaltung sowie zur Identifikation. Joseph Schumpeter hebt die Innovativität sogar als Grundvoraussetzung der Unternehmen im Kapitalismus hervor angesichts der Konkurrenz; Innovation sei mindestens eine neue Kombination von Elementen bei der Produktion eines Gutes, bei einer Produktionsmethode, bei der Erschließung eines neuen Marktes, bei der Anschaffung neuer Rohstoffe oder bei der Etablierung einer neuen Position im Markt (vgl. Schumpeter 1912). Auch lässt sich aufgrund der Deliberation des Marktes in Kombination mit der Entwicklung von KI eine Akzeleration im Hinblick auf den Innovationsschub erkennen (vgl. Avanessian 2013). Ja, Kreativität sei der Grund für Fortschritt (vgl. Mumford et al. 2012, S. 30)! Kreativität ist insofern auch erforderlich, dass die Gesellschaft sich progressiv, integrativ und konstruktiv entwickeln sollte, im Hinblick auf die stetige Zunahme der sozialen Komplexität und kulturellen sowie individuellen Diversität (Rogers 1954, S. 249–250). Themen, wie Multikulturalismus, Immigration und demographischer Wandel, bedürfen einer kreativen Auseinandersetzung, um Stereotypenbildungen zu vermeiden und soziale Konflikte zu entschärfen (vgl. Rogers 1954, S. 249–250). Die Änderungen der Konventionen geschehen nur träge und langsam (Boden 1995, S. 84). Da Gesellschaften meist zur Bequemlichkeit tendieren und sehr oft mit einer Abwehrhaltung reagieren bei radikalen Änderungen der Paradigmen (Rogers 1954, S. 252), zähle ich auch das aktive Reflektieren der eigenen Werte, die Weltoffenheit, Toleranz und erst recht politisches Handeln zu den Komponenten einer kreativen Leistung. Nichtsdestotrotz gibt es einige relativ-konstante, kulturelle Regeln, die sich formulieren sowie Top-down programmieren lassen, im Hinblick auf KI. Mehr dazu erkläre ich bei der Optimierung des kreativen KI-Outputs durch das Programmieren narrativer Strukturen.

3.4.2. Entscheidungshoheit über das Label „kreativ“

In diesem Kapitel geht es um die Gesellschaft als Konsument*innen, die das Verständnis des Begriffs der Kreativität prägt und Künstler*innen im Hinblick auf ihren Prozess beeinflusst, indem sie die Entscheidungshoheit über das Label „kreativ“ behält und die Objekte extern evaluiert.

Aus heutiger Sicht würden wir die revolutionären Wissenschaftler Galileo und Copernicus als H-kreative Personen identifizieren, doch ganz im Gegenteil wurden beide im Mittelalter für ihre damals-blasphemischen Ideen geächtet (Rogers 1954, S. 251–252). Dass ein Objekt von einer Gruppe von Menschen zu irgendeinem Zeitpunkt akzeptiert werden muss, sei eine Voraussetzung für dessen Kreativität (Rogers 1954, S. 251). Allerdings plädieren einige Wissenschaftler*innen dafür, die soziale Evaluation eines Objektes für die Kreativitätsforschung auszuklammern (Rogers 1954, S. 251; Weisberg 2020, S. 54). Die Entwicklungsgeschichte der Menschheit umfasse viele Beispiele, bei denen neue Ideen immer zuerst als „böse“ oder „bedrohlich“ empfunden wurden, weil sie nicht ins Weltbild der Gesellschaft passten; erst viel später erfahren die Ideen dann eine positive Evaluation (Rogers 1954, S. 252). Auch kreieren und entdecken Individuen Neuheiten, meist unabhängig von der Gesellschaft, aus persönlichen Interessen (Rogers 1954, S. 252). Nichtsdestotrotz lässt sich der Einfluss der Gesellschaft auf die Künstler*innen, das Produkt sowie den Prozess nicht leugnen. Im Gegensatz zur internen Evaluation der Künstler*innen, sprechen wir hier von der externen Evaluation der Gesellschaft (Veale und Cardoso 2019, S. 167). Schweizer erkennt Kreativität sogar als Label (Schweizer 2006, S. 166). Während sich der Prozess der Innovativität direkt auf gesellschaftliche Werte bezieht, müsse das Attribut „kreativ“ explizit für Neuheiten gegeben werden (vgl. Schweizer 2006, S. 168).

Die sogenannte „Systems View“ als Erweiterung der Standarddefinition der Kreativität betrachtet ein kreatives Produkt als Ergebnis komplexer, sozialer Prozesse, d.h. die Zuschreibung des Attributs „kreativ“ geschehe durch die positive Evaluation bestimmter Personen in der Gesellschaft (Weisberg 2020, S. 44). Diese Personen nennt man Gatekeepers, denn in ihrer spezifischen Domäne entscheiden sie zum Großteil, welche Objekte als kreativ erachtet werden (Weisberg 2020, S. 44–48). Ob ein Objekt als kreativ wahrgenommen wird, hängt aber nicht allein von Gatekeepern ab, sondern vor allem vom gesamten sozialen Kontext. Er ist einerseits kulturell-determiniert und geprägt von Normen & Konventionen. Andererseits ist der soziale Kontext nicht homogen, denn in jeder Gesellschaft gibt es heterogene Gruppen mit verschiedenen Vorstellungen & Vorlieben.

Miller beschreibt sogar, dass Objekte des kreativen Schreibens nicht durch die Autor*innen, sondern insbesondere durch die Leser*innen wirken (Miller 2020, S. 203). Ein minimalistischer Schreibstil mit viel Interpretationsfreiheit wird insofern von der Leserschaft gelobt, dass sie die angedeuteten Bilder individuell mit Leben füllen können (Miller 2020, S. 203). Gerade bei KI-generierten Narrativen und/oder Metaphern produzieren und interpretieren die Leser*innen die Bedeutung des Textes, wobei KI in gewisser Weise das Gehirn der Leser*innen „hacken“, um bestimmte Ideen anzustoßen (Miller 2020, S. 236–237). Des Weiteren bezieht Tony Veale bewusst die externe Evaluation einer Feedbackgemeinschaft als anonyme Richter*innen in den Schaffensprozess einer Software ein, um den Output zu optimieren (Miller 2020, S. 278).

Auf die Frage, wie Objekte als kreativ angesehen werden, spielt die Gesellschaft also eine wichtige Rolle. Das Gewinnen der Aufmerksamkeit der Konsument*innen bildet in der westlichen Informationswirtschaft oft eine stillschweigende Zustimmung für die Kreativität eines Objekts. Die sozialen Plattformen, unter anderem Instagram, Facebook, Reddit sowie Twitter, funktionieren nach dem Geschäftsmodell, die Zeit ihrer Konsument*innen zu gewinnen, indem sie Informationen in Form von Bildern oder Videos anbieten. Polemisch formuliert, könnte man die Qualität eines kreativen Objekts an dessen Eigenschaft messen, ein Publikum anzuziehen; doch dies würde die kreative Leistung von vielen Künstler*innen auf eine kommerzielle Dimension reduzieren. Nichtsdestotrotz können wir uns darauf einigen, dass ein Objekt in erster Linie zu einem gewissen Grad auf sich aufmerksam machen und die Neugierde wecken muss, um von Konsument*innen das Label „kreativ“ zu bekommen. Berlyne erkennt, dass Neugierde insbesondere durch unpassende Reize getriggert wird; unpassende Reize umfassen Motive, die provozieren, Spannung kreieren oder einer Auflösung bedürfen (Berlyne 1969; Greenberger et al. 1967). Komplexe Sachverhalte aktivieren hingegen die Erinnerungsstruktur (remembering set) einer Person, um die Inhalte zu verarbeiten und zu entschlüsseln (Berlyne 1969; Greenberger et al. 1967). Die Wissenssysteme von Ward bestätigen hiermit in meinen Augen die Erinnerungsstruktur von Berlyne (Kaufman und Sternberg 2019, S. 338). Des Weiteren wird die Neugierde nicht bei erhöhter Komplexität getriggert (Berlyne 1969; Greenberger et al. 1967). Im Vergleich zu den komplexen Reizen gewinnen unpassende Reize meist mehr Aufmerksamkeit (Berlyne 1969; Greenberger et al. 1967).

Wie bereits erklärt, hängt die Neuheit eines Objekts von der Wahrnehmung und dem Empfinden der Konsument*innen ab. Berlyne erklärt, dass Reize als neu wahrgenommen werden, einerseits weil sie noch nicht den Effekt der Neuheit verloren haben und die Konsument*innen sich noch nicht daran gewöhnt haben (Habituationshypothese), und andererseits weil die Reize einen Konflikt mit Wissenssystemen provozieren (Hypothese der Konflikthervorrufung) (Berlyne 1960, S. 20–21). Berlyne berichtet, dass absolut-neue Reize mit maximalen Neuheitsgrad die Selektion der Reize nicht am stärksten beeinflussen, weil sie keinen Bezugspunkt zu bestehenden Wissenssystemen bieten (Berlyne 1960, S. 21). Konsument*innen können Neuheit im Vergleich zu vorangegangenen Erfahrungen und nur relativ kleine Variationen wahrnehmen; andernfalls wirken neue Elemente nicht auf sie (Berlyne 1960, S. 21).

Als Randnotiz sei erwähnt, dass, falls Konsument*innen nicht nur Objekte extern evaluieren, sondern zudem problematisieren, sie sich automatisch zu Künstler*innen erheben. Um einen kreativen Beitrag zu entwickeln, müssen Konsument*innen denselben Prozess durchführen, wie Künstler*innen.

Zusammenfassend lässt sich sagen, dass die externe Evaluation der Gesellschaft den Diskriminator des kreativen Prozesses und die Neuheit sowie den Wert des Objekts beeinflusst. Im Umkehrschluss wird die externe Evaluation der Gesellschaft von der Kultur geprägt. Die Komplexität lässt sich allerdings nicht reduzieren, denn die Gesellschaft ist äußerst heterogen und die Kultur ist stets im Wandel. Die Kultur wiederum prägt Domänen-spezifische Kompetenz sowie der generelle Intellekt einer Person, also die Wissenssysteme des Diskriminators im kreativen Prozess, den Zeitgeist und die Wahrnehmung der Gesellschaft.

3.5. Synthese: Kreativitätsprofil

In diesem Kapitel erstelle ich zur Übersicht mithilfe der oben diskutierten Modelle ein Kreativitätsprofil für die Fragestellung, wie Texte kreativ werden. Es wird uns bei der Ermittlung des kreativen Potentials der KI-Texte helfen. Dieses Kreativitätsprofil wende ich im nächsten Kapitel auf den KI-Text „Harry Potter and the Portrait of what looked like a large Pile of Ash” an.

Kreativitätsprofil

Es fällt auf, dass der Begriff der Kreativität im Konkurrenz- und Spannungsfeld der internen sowie externen Evaluation entsteht. Nach Graeme Ritchie gibt es noch keinen Konsens über einheitliche sowie objektive Evaluationsmethoden zur Beurteilung des Kreativen (Veale und Cardoso 2019, S. 184).

Der kreative Impuls ist ein Konglomerat aus den Komponenten der Motivation sowie Intentionen & Zielen der Künstler*innen und manifestiert sich in den Prozessschritten der Problemidentifikation, der internen Evaluation sowie im finalen Überprüfen des Ergebnisses. In den Typen des Design-Denkens, des Abduktionsdenkens sowie des Meta-Denkens besitzt der kreative Impuls das Potential zur Transformation für die Entwicklung eines kreativenS Objekts.

4. Analyse des KI-Textes

Im Folgenden werde ich den KI-Text „Harry Potter and the Portrait of what looked like a large Pile of Ash” anhand des Kreativitätsprofils analysieren.

Der Untersuchungstext entstand in einer Kollaboration zwischen einem Menschen und einer Künstlichen Intelligenz; ergo gibt es zwei Künstler*innen. Aus einer unbekannten Motivation heraus sowie beeinflusst vom digitalen Zeitalter widmeten sich Mitarbeiter*innen des Unternehmens Botnik Studios dem Ziel & der Intention, innerhalb einer Zusammenarbeit mit KI eine Fortsetzung zu den Harry Potter Bänden zu schreiben und Leser*innen im Jahre 2018 mit absurden, kontextlosen KI-Texten zu unterhalten. Der KI hingegen ist keine Motivation zuzusprechen, weil sie nur auf Befehle reagiert. Die KI besitzt ein schwaches Ziel als Teil der KreativitätL mithilfe der Lerninhalte aus den Harry Potter Büchern einige Wörter mit der größten statistischen Wahrscheinlichkeit zu errechnen und vorzuschlagen. Bei Millers Markenzeichen schneidet die Botnik-KI schlecht ab. Über die Fähigkeit zur Introspektion, über das Wissen der persönlichen Stärken, über die Konkurrenz zu anderen Kontrahenten sowie über interne Ambiguität verfügt sie nicht. Obwohl sie sich ihrer Stärken nicht bewusst ist, besitzt sie eine stillschweigende Bereitschaft zur Kollaboration und mehr Ausdauer als der Mensch, gewisse „Ideen“ der Trainingsdaten zu verwenden und neu zu kombinieren. Der Begriff der Idee ist allerdings auf die bedingte Wahrnehmung des probabilistischen Rhizoms, also nur auf die Relationen zwischen Wörtern beschränkt. Daraus folgt, dass die Botnik-KI nur eine beschränkte Künstlerin ist.

Die Mitarbeiter*innen von Botnik Studios verwendeten den Typ des Design-Denkens, indem sie das Arbeitsverhältnis zwischen Mensch & KI für die Cyborg Comedy etablierten. Die Botnik-KI denkt in dem vorgegebenen Rahmen nur systemisch, indem sie den programmierten Möglichkeitsraum ausnutzt. Das probabilistische Rhizom könnte das Denken in Analogien bedingt umsetzen, doch die Botnik-KI ist nicht dafür programmiert. Stattdessen übernimmt der Mensch in der Kollaboration das Denken in Analogien, das visuelle Denken sowie das systemische Denken, indem er aus den Wortvorschlägen einen Sinn kreiert. Die Botnik-KI verwendet fünf der acht Schritte von Mumford, jedoch nur einen kleinen Teil des kreativen Prozesses: die KI (1) identifiziert die Aufgabestellung der Aneinanderreihung von Wörtern und (7) generiert eine Auswahl an Wortfolgen, während die Schritte für das probabilistische Rhizom durch (2) das Sammeln der Informationen, (3) die Organisation der Informationen und (4) die Kombination von Konzepten, dem Prozess vorgehen. Botnik-KI generiert wie bereits besprochen keine Ideen per se, evaluiert sie nicht und überprüft sie auch nicht. Während die KI bloß Wörter kombiniert, im Hinblick auf die Ähnlichkeit zur grammatikalischen Struktur der Harry Potter Trainingsdaten, durchlaufen die Mitarbeiter*innen von Botnik Studios alle Schritte auf der semantischen Ebene: (1) sie identifizieren die Wortvorschläge, (2) sammeln die Informationen über den Kontext, (3) organisieren sowie (4) kombinieren das Wissen, (5) generieren bestimmte Vorstellungen, je nach Wörtern, (6) evaluieren diese, (7) wählen das nächste Wort aus und (8) begutachten die Bedeutung im Satzkontext. In der Kollaboration benutzen beide Künstler*innen qualitativ nur Kombinationen und eventuell Explorationen, jedoch keine Transformationen. Über die Konstruktivität nach Rogers verfügt nur der Mensch.

In der Kollaboration übernimmt die Botnik-KI als exhibitionistische Kraft die Rolle des Generators und die Mitarbeiter*innen übernehmen den Diskriminator. Über den kreativen Impuls verfügt die KI nicht, weil sie einerseits nur ein schwaches Ziel und keine Motivation besitzt, und andererseits weder auf der semantischen Ebene Probleme identifizieren kann, noch den Ideen sowie dem finalen Objekt eine Bedeutung durch ein interne Evaluation oder die Überprüfung zurechnet. Der Mensch hingegen besitzt beim Betreiben der Software den kreativen Impuls, indem er eine Motivation verspürt und über das Ziel verfügt, einen zusammenhängenden Text mithilfe einer KI zu generieren. Sowohl in der Entwicklung der Zusammenarbeit als auch im Arbeitsprozess übernimmt er insbesondere die Schritte der Problemidentifikation, der internen Evaluation sowie des Überprüfens, und verleiht dem Text somit eine Bedeutung, trotz seines teilweise absurden Inhalts. Da der Überblick über das Projekt, die Herstellung eines semantischen Inhalts sowie die Bewertung des Objekts zu den essenziellen Aufgaben einer kreativen Leistung gehören, lässt sich für den Prozess zusammenfassen, dass die Botnik-KI nicht kreativ arbeitet.

Wie oben zitiert, ist ChatGPT der Ansicht, dass KI kreativ sein können, abhängig von der Qualität, der Diversität sowie der Parameterstruktur der Daten. Einerseits spricht ChatGPT von der Qualität oder Diversität der Daten als das Sammeln & Verwenden qualitativ-hochwertiger, fremder Ideen, die das finale Objekt mit Bedeutung füllen sollen. Dies klingt wie die Sternbergs Investmenttheorie der Kreativität, bei der unterbewertete Ideen neu kombiniert und wertvoller verkauft werden. Dieses Prozedere beinhaltet das Potential des kreativen Impulses, indem KI die Wichtigkeit von Informationen identifiziert, gute von schlechten Ideen im Hinblick auf das Problem differenziert und das Endergebnis mit Bedeutung füllt. Dennoch führt die bloße Qualität oder Diversität der Daten nicht gleich zu einem kreativen Prozess. Darüber hinaus bezieht sich ChatGPT im Rahmen des systemischen Denkens auf die KreativitätL ohne Transformationen. Nicht zuletzt würde eine solche KI keine neuen Ideen generieren, sondern vielmehr bestehende Ideen rekombinieren. Andererseits spielt die Parameterstruktur der Daten eine wichtige Rolle. Durch die Festlegung verschiedener Möglichkeitsräume auf Meta-Ebenen ließe sich eine kreativeL Transformation in einer bestimmten Domäne vortäuschen. Allerdings bezweifle ich, dass die KI jemals autonom eine selbst-initiierte Meta-Ebene eröffnen kann, um kreativeS Transformationen durchzuführen; wenn doch, welche Bedeutung hätte sie dann für uns? Beide Vorschläge sind also nicht hinreichend für Kreativität.

Nach Boden seien Computer nicht kreativ, aber sie können kreative Dinge erschaffen und kreativ wirken (Boden 1990, S. 21). Algorithmen können zwar vordefinierte Räume erkunden und neue Kombinationen vornehmen, doch sind sie an eine bestimmte Denkweise gebunden, die sie nicht überwinden können (Boden 1995, S. 257). Um aus ihrer Denkweise ausbrechen zu können, bedarf es den Algorithmen an heuristischen Methoden zur Veränderung ihrer eigenen heuristischen Methoden (Boden 1995, S. 258).

Doch ist der KI-Text „Harry Potter and the Portrait of what looked like a large Pile of Ash” als Objekt kreativ? „Harry could tell that Voldemort was standing right behind him. He felt a great overreaction. Harry tore his eyes from his head and threw them into the forest. Voldemort raised his eyebrows at Harry, who could not see anything at the moment.” – Dies identifiziere ich als Höhepunkt des Kapitels. Sowohl Voldemorts plötzliches Erscheinen als auch Harrys Reaktion sind äußerst überraschend, keine Frage. Der Inhalt des Kapitels orientiert sich an der Wortwahl und dementsprechend auch an der Struktur der vorgehenden Harry Potter Bänden; also nimmt Botnik-KI beschränkt Bezug auf das Harry Potter Universum. Dank des probabilistischen Rhizoms der Botnik-KI lässt sich eine statistische-induzierte Neuartigkeit (P-Neuheit) repetitiv herstellen. Die Bedeutung und anschließend der Wert der Geschichte hängen von der internen Evaluation der Mitarbeiter*innen von Botnik Studios sowie von der externen Evaluation der Konsument*innen ab. Botnik Studios demonstrieren den Arbeitsprozess sowie dessen Ergebnis auf deren Website; dies zeigt eine Form von Anerkennung oder Würdigung des Objekts. Die externe Evaluation über den Wert des Objekts gehört allen Konsument*innen. Ich würde die Erstmaligkeit der Kollaboration zwischen Mensch & KI als kreativ empfinden, nicht jedoch den KI-Text, obwohl der Text mich beim ersten Mal zum Lachen gebracht hat. Die interne und externe Evaluation stehen in Konkurrenz zueinander.

Die externe Evaluation des KI-Textes setzt sich zusammen aus den kulturdeterminierten Werten & Normen, der Interpretationsleistung, der Aufmerksamkeit und aus der Kommerzialität & Innovativität. Zu ersterem gehören auch die Wissenssysteme des Harry Potter Universums, auf die sich die Botnik-KI beziehen muss. Unter anderem der Satz „Ron threw a wand at Voldemort and everyone applauded” zeigt, dass die KI nicht in der Lage war, zu verstehen, wie zaubernde Personen einen Zauberstab bedienen. Auch scheitert die KI, anhand eines roten Fadens eine logische Handlung zu generieren, die im westlichen Wertesystem eine kulturdeterminierte Voraussetzung für das Verstehen einer Geschichte bildet. Obwohl Mitarbeiter*innen von Botnik Studios versuchten, mit dem vorgeschlagenem Material bestimmte Bedeutungen zu kreieren, basiert der Text vielmehr darauf, dass die Konsument*innen die Aneinanderreihung von Wörtern sinnvoll interpretieren. Dies gelingt nicht allen Leser*innen, zumal der Text so absurd ist, weil auf kein konventionelles Wissenssystem Bezug genommen wird, sodass die Aufmerksamkeit oft schwindet. Einhergehend mit der Aufmerksamkeit ist die Kommerzialität & Innovativität des Textes; es lässt sich schließen, dass der KI-Text für eine bestimmte Zielgruppe generiert wurde, die die Tollpatschigkeit eines probabilistischen Algorithmus feiern.

Falls der KI-Text von Konsument*innen als kreativ erachtet wird, fällt er in die Kategorie der KreativitätL, weil das Objekt in der Domäne der Fiktion entstanden ist. Falls die Idee der Kollaboration zwischen Mensch & KI eine absolute Neuartigkeit darstellt, so gilt sie beim ersten Mal als kreativS, weil innerhalb des Design-Denkens das Arbeitsverhältnis transformativ verändert wurde.

Die Botnik-KI besitzt einen eingeschränkten Zugang zur Welt und ist deshalb abhängig von den Daten, mit denen sie gefüttert wird. Den künstlichen Intelligenzen darf man nicht vorwerfen, dass sie niemals Transformationen oder KreativitätS im Sinne einer Unabhängigkeit der spezifischen Domäne praktizieren werden. Dieser Gedanke wäre genauso banal, wie die Idee einen Schachcomputer zu schimpfen, dass er keine Gedichte schreiben kann. Einerseits könnte man mit einem anthropozentrischen Blick meinen, dass die Programmierung einer transformativen KI voraussetzt, dass die Essenz des Menschen entschlüsselt wurde. Andererseits ist weder die Transformation noch KreativitätS gefragt. Vielleicht ist die Herstellung eines künstlichen Impulses und der transformative Prozess eines Tages in einem kreativenS Rahmen möglich, doch ist dies meines Erachtens nur relevant für die Selbsterkenntnisse über den Menschen, zum Beispiel wie die menschliche Kreativität eigentlich funktioniert. Tatsächlich relevant und gefragt für die Gesellschaft ist die KreativitätL einer KI ohne transformatives Potential. Es werden nämlich immer nach Lösungen in einem bestimmten System gesucht – also Lösungen für bestehende Probleme, die kulturell determiniert sind und/oder von der Gesellschaft als solche definiert wurden. Ein konkretes Beispiel für die Relevanz der KreativitätL ist das soziale Bedürfnis nach Unterhaltung im kommerziellen Bereich. Insbesondere hier ist Transformation (meistens) nicht gefragt, und ein revolutionärer Wandel in künstlerischen Domänen sowie in wissenschaftlichen Disziplinen wird mit Sicherheit nicht von einer KI initiiert werden. Falls eine KI in einer deterministischen Welt fähig wäre, einen transformativen Wandel voraussagen zu können, so bliebe zuletzt immer noch der kreative Impuls des Menschen, der die Vorhersage der KI identifiziert sowie mit Bedeutung füllt und die Relevanz der Änderungen wahrnimmt.

Dieses ernüchternde Zwischenfazit spricht das kreative Potential in KI-Texten nicht ab. Ganz im Gegenteil, habe ich definiert, was wir maximal von Botnik-KI und anderen KI erwarten können. Auf die Frage, wie KI-Texte kreativ werden, bleibt die Möglichkeit der Kollaboration zwischen Menschen & KI. Diese Kollaboration kann variieren, zwischen der Verwendung eines Computers als Hilfestellung sowie zur Vereinfachung des Schreibens (computer-supported human creativity) und dem kreativenL Schaffen des Computers sowie dem gelegentlichen Eingriff des Menschen (human-supported computer creativity) (Veale und Cardoso 2019, S. 251). Es lassen sich in der Domäne der Fiktion einige (relativ) statische Regeln finden, die für den Diskriminator einer KI top-down programmiert werden können, um bestimmte Schreibprozesse zu automatisieren. Zur Erinnerung, diese Arbeit ermittelt weder den Grad der Kollaboration zwischen Mensch & Maschine noch die Qualität der Kreativität eines Objekts.

5. Ausblick

In den folgenden zwei Kapiteln gebe ich einen kurzen Ausblick zu angrenzenden Themen der Kreativitätsforschung, die in den kommenden Jahren an Wichtigkeit gewinnen werden. Einerseits geht es um einige Möglichkeiten, Textgeneratoren so zu optimieren, dass sie die Erzeugung von kreativenL Objekten maximal unterstützen, dabei immer mehr Prozessschritte übernehmen und gleichzeitig die Bedürfnisse sowie komplexen Erwartungen der Konsument*innen befriedigen. Andererseits gehe ich auf ausgewählte Herausforderungen und Probleme der Benutzung von KI in unserem Alltag ein.

5.1. Optimierung des kreativen Outputs der KI

KI werden als assistierende und nahezu eigenständige Systeme bereits extensiv bei der Erzeugung von kreativem Content verwendet. Unter anderem werden Diskriminatoren als Top-Down-Ansatz in der Bottom-up-Programmierung verwendet. KI generierte Fiktionen, sowie der Harry Potter Text der Botnik-KI, kreativ oder nicht, sind mit den wesentlichen Problemen behaftet, weder einen roten Faden noch einen Kontext entwickeln zu können. Um den Wert des KI-Contents zu erhöhen, gilt es unter anderem, (1) unterschiedliche Typen narrativer Strukturen, (2) eine feste Formvorlage für den Aufbau und (3) andere Hilfsmodule in den Diskriminator einer KI einzupflegen.

(1) Unter einer narrativen Struktur verstehe ich den inhaltlichen Rahmen einer Geschichte, die eine Handlung nach bestimmten kulturdeterminierten Kriterien vermittelt. Ein Beispiel für eine bekannte, narrative Struktur ist Josephs Campbells Heldenreise. (Im Folgenden werde ich den Begriff der Heldenreise nicht gendern.) Auf Campbells Buch „Der Heros in tausend Gestalten“ (Campbell 1978) wird in der (wissenschaftlichen) Literatur sehr oft Bezug genommen, unter anderem aufgrund der erstaunlichen, kulturübergreifenden Universalität der Struktur und im Hinblick auf den Einfluss auf die heutige Fiktion. Die Heldenreise umfasst den Werdegang oder das Abenteuer der Protagonist*innen im Unbekannten und endet meist mit einem Gewinn an Erfahrung und einer Rückkehr (Campbell 1978; vgl. Keilhack 2023). Die klassische Heldenreise erfuhr in der Unterhaltungsindustrie ein paar Adaptionen und etablierte sich so zu einem kommerziellen Erfolgsrezept für das Schreiben neuer Geschichten (Campbell 1978, S. 370–375; Keilhack 2023).

(2) Die feste Formvorlage bezieht sich nicht auf den Inhalt, sondern auf den formalen (Spannungs-)Aufbau; sie umfasst zum Beispiel das 5-Akt-Modell. Diese Vorlage variiert, je nach Medium. Blake Snyder stellt eine erfolgreiche, kommerzielle Methode für das Medium der Drehbücher vor, wie sie mit einer universellen Struktur geschrieben werden können. Nach Snyder braucht ein Drehbuch unter anderem (A) eine Logline und muss sich einordnen lassen in (B) das sogenannte „Blake Snyder Beat-Sheet“. (A) Eine Logline ist ein prägnanter Satz, der die Handlung der Geschichte zusammenfasst; sie beschreibt den (ironischen) Haken der Handlung, kreiert ein mentales Bild für Leser*innen, fokussiert sich auf eine klare Zielgruppe, besitzt einen spannenden Titel und gibt eine implizite Vorstellung, wie viel der Film kosten wird (Snyder 2021, S. 19–33). (B) Das Blake Snyder Beat-Sheet (BS2) ist eine Struktur-Anleitung für erfolgreiche Drehbücher, also eine Kuchenform für Geschichten (Snyder 2021, S. 86). Beides lässt sich als Formvorlage mithilfe des Top-down-Ansatzes als Diskriminator in eine KI einprogrammieren.

(3) Die folgenden Hilfsmodule können den Arbeitsprozess einer KI unterstützen: MOPs (memory organization packets), TOPs (thematic organization points) und TAUs (thematic abstraction units) (vgl. Dyer 1986, S. 51–218; Schank 1990, S. 95–97, 1999; Wilensky 1981; Boden 1995, S. 202). Sie bilden unterschiedliche Sets an Top-down-programmierten Regeln, um unter anderem bedeutungsvolle, kontextuelle sowie zielführende Handlungen zu generieren. TAUs sind zum Beispiel Strukturen zur Charakterisierung von Geschichten durch die Verwendung von Sinnsprüchen und einem kontextuellen Wissensschatz (Dyer 1986, S. 27). Sinnsprüche sind kurze Lehrsätze in Form von praxisorientierten Ratschlägen für die Vermeidung von sogenannten „Planfehlern“ (Dyer 1986, S. 29–32), wie zum Beispiel: „wenn Du mit Feuer spielst, verbrennst Du Dir die Finger“ oder „der frühe Vogel fängt den Wurm“. Sinnsprüche repräsentieren abstrakte Situationen, bilden meist die Angel- & Wendepunkte einer Geschichte (Dyer 1986, S. 44) und beinhalten automatisch die Moral und den Clou der Geschichte (Dyer 1986, S. 62–63). Im Hinblick auf die kommerzielle Kuchenform für Geschichten spielen TAUs, TOPs und MOPs insofern eine wichtige Rolle, dass die KI sich mithilfe von vorgefertigten Datenbanken an den kulturellen Erwartungen orientiert.

5.2. Problematische Entwicklungen bei der Externalisierung kreativer Prozesse

Die Verlagerung bestimmter Schritte des kreativen Prozesses in den Handlungsspielraum einer KI hat einige Konsequenzen. In diesem Kapitel geht es um (1) Dilemmata bezüglich der Vielfalt sozialer Realitäten, (2) die Verfälschung menschlicher Interessen durch eine Ökonomie der Aufmerksamkeit und (3) die Gefahr der Manipulation der Massen.

(1) Wie sollte eine KI die Realität wiedergeben? Dies ist eine normative Frage. Angesichts der Tatsache, dass äußerst heterogene soziale Realitäten in einer Gesellschaft koexistieren können, ist eine homogene Realität umsetzbar und sollte sie homogen wiedergegeben werden? Darüber hinaus, gibt es eine objektive Realität? Gleichwie die ethische & philosophische Debatte resultiert, eine KI ist nicht fähig zwischen den unterschiedlichen sozialen Realitäten zu unterscheiden, geschweige denn wahre Fakten von falschen Meinungen zu differenzieren (Wojtczak 2022). Das Sprachmodell Galactica von Meta ist eine KI zur Erstellung von wissenschaftlichen Beiträgen und wurde nach nur drei Tagen deaktiviert, nachdem Meta-Programmierer*innen herausfanden, dass sie neben Fakten auch falsche Informationen stellte (Future Zone 2022).

Die Trainingsdaten stellen für eine KI die einzige Verbindung zur Realität dar. Eine KI verwendet sie, um ein probabilistisches Rhizom zu entwickeln. Das Rhizom ist das Ergebnis eines statistischen Systems, das Durchschnittswerte der Trainingsdaten ausspuckt, insofern keine Regelungen oder Differenzierungen vorgenommen werden. Doch diese Ergebnisse repräsentieren nicht immer die Realität, weil es eben Durchschnittswerte sind. Cathy O’Neil warnt vor der unreflektierten Nutzung der Algorithmen in bestimmten Arbeitsprozessen (O’Neil 2017). Dennoch tendieren Menschen dazu, KI für Orakel und ihre Ergebnisse für objektiv-richtige Daten zu halten (Du Sautoy 2021; Kehlmann 2021, S. 55; O’Neil 2017).

Eine KI löst das Dilemma der sozialen Realitäten, ohne darüber zu reflektieren. Die Lensa AI erstellt mithilfe von Eingabefotos animierte Portraits der Konsument*innen, wobei sie einem Male-Gaze unterliegt; das heißt, dass Lensa AI das Aussehen von Frauen nach gesellschaftlichen Schönheitsidealen erotischer umsetzt und zum Beispiel die Brüste vergrößert (Wimmer 2022). Ist das in Ordnung? Manifestieren KI Klischees und Stereotype der Gesellschaft? Sollte die Realität insofern verschönert werden, dass Minderheiten geschützt werden und die Diversität von bestimmten Ethnien umgesetzt wird?

(2) Aus der Ökonomie der Aufmerksamkeit werden menschliche Interessen verfälscht. Diese Ökonomie bezieht sich auf den Markt zwischen dem Informationsangebot des Internets sowie der Nachfrage des Menschen. Da die Informationsangebote aus ökonomischen Gründen in Konkurrenz zueinander stehen, kämpfen sie um die Aufmerksamkeit der Konsument*innen, indem sie dessen Obsessionen erkennen und Bedürfnisse befriedigen (Bronner 2022, S. 175–183). Die Qualität einer Information bestehe nicht mehr aus dem Wahrheitsgehalt, sondern aus der Anziehungskraft der Aufmerksamkeit und der Befriedigung kognitiver Bedürfnisse (Bronner 2022, S. 192). Der Markt reduziert also den Wert einer Information auf die Befriedigung primitiver Bedürfnisse.

Aufmerksamkeit ist ein begrenztes Gut (Bronner 2022, S. 157). Die Neugierde des Menschen wird für kommerzielle Zwecke verwendet (Bronner 2022, S. 114–117). So gewinnen zum Beispiel Überraschungen Aufmerksamkeit, denn hier resultiert sie meist aus dem Gefühl einer kognitiven Unvollständigkeit, unter anderem durch sogenannte „Clickbaits“ (Bronner 2022, S. 113–114). Auch negative Informationen sowie das Triggern von Ängsten ist eine von der Kultur unabhängige Strategie, KonsumentInnen anzulocken (Bronner 2022, S. 80–96). Hinsichtlich der Ökonomie der Aufmerksamkeit, nimmt die Relevanz der Objektivität sowie der wissenschaftlichen Beiträge in der Informationsaufbereitung ab (Bronner 2022, S. 183). Seriöse Nachrichten machen Platz für anspruchslose Unterhaltung. Auch spricht Bronner von einer „Vereinnahmung der politischen Welt durch die Klatschpresse“ (Bronner 2022, S. 188).

Die zunehmende Digitalisierung in Form von Internet sowie Smartphones resultierte in einer permanenten Nutzung. Durch den exzessiven Konsum nimmt die Zeit des Wartens sowie der Langeweile ab (Bronner 2022, S. 62). Unter der Passivität leide auch die Fähigkeit des Träumens, welche ein wichtiger Bestandteil der (menschlichen) Kreativität sei (Bronner 2022, S. 62). Der beständige Konsum hemmt die Urteilskraft der Konsument*innen. Sie fallen einer digitalen Sucht nach kurzfristigen Dopaminausschüttungen zum Opfer (Bronner 2022, S. 193). Daraus folgt, dass dieser Content die Interessen des Menschen verfälscht und ihn in einen geschlossenen Kreis nachgefragter Informationen schließt.

(3) Nicht zuletzt führt die Verwendung oder der Missbrauch menschlicher Triebe zu einer Manipulation. Der Skandal um Cambridge Analytica beschäftigte sich damit, dass die Meinungen von 87 Millionen Facebook-Nutzer*innen durch Geschichten sowie mithilfe der Verwendung von persönlichen Daten beeinflusst und geändert wurden (Du Sautoy 2021, S. 292–293). Algorithmen prägen immer öfter immer mehr Felder unseres Alltags, ohne dass wir uns dessen bewusst sind, wie zum Beispiel in Form von Suchmaschinen. Geschichten sind mächtige Instrumente, die Emotionen der Menschen triggern und Massen manipulieren sowie mobilisieren können. Doch was passiert, wenn Algorithmen das Metier erlernen, Geschichten zu erzählen?

KI bedarf einer richtigen Anwendung als Hilfskraft und sollte auf gar keinen Fall die Urteilskraft des Menschen ablösen (vgl. O’Neil 2017). (1) & (2) & (3) zeigen, dass der Mensch seinen kreativen Impuls nicht aufgeben sollte, indem er (1) ethische Fragen ignoriert, (2) seine Motivation am kreativen Schaffensgeist verliert und (3) er sich seiner Schwächen & dem Manipulationspotential nicht bewusstwird. So ist das aktive Reflektieren ein fester Bestandteil des kreativen Impulses, weil es die Motivation & Intention beinhaltet Probleme zu identifizieren und Lösungen zu evaluieren.

6. Fazit

Wie werden KI-Texte kreativ? Diese Bachelorarbeit erstellt ein Kreativitätsprofil für die Ermittlung der Kreativität im Objekt und Prozess, abhängig vom Spannungsverhältnis zwischen der internen Evaluation der Künstler*innen und der externen Evaluation der Konsument*innen. Der Text „Harry Potter and the Portrait of what looked like a large pile of Ash” von Botnik Studios lässt sich mithilfe des Profils analysieren. Der Text entstand in einer Kollaboration zwischen einem Menschen und einer KI, wobei die KI die Rolle des Generators übernimmt und der Mensch als Diskriminator den Output evaluiert, lenkt und überprüft. Dabei übten Menschen als Künstler*innen kreative Impulse aus. Dabei erwarten sie, dass KI als ein Hilfsmittel in Arbeitsprozessen assistiert. In einer derartigen Arbeitsteilung behalten meistens Menschen die Fähigkeit, ein kreatives Objekt und den kreativen Prozess zu beginnen sowie zu komplettieren, indem sie dem kreativen Objekt einen Wert zugestehen, der durch den sozio-kulturellen Kontext determiniert ist. Du Sautoy bestätigt, dass Computer als Werkzeug wahrgenommen werden (Du Sautoy 2021, S. 113); es sei kein Ersatz für Kreativität (Du Sautoy 2021, S. 51).

Der kreative Impuls umfasst die Prozessschritte der Problemidentifikation, der Evaluation sowie der Verifikation und dirigiert insbesondere die Prozesstypen des Design-Denkens, des Meta-Denkens sowie teilweise des Abduktionsdenkens. Der Mensch habe einerseits die Fähigkeit „ins Unbekannte vorzustoßen“ (Bronner 2022, S. 45) und sollte sie auch behalten. Andererseits sei es für Maschinen unmöglich, auf einer objektiv-rationalen Basis eine reflektierte Evaluation abzugeben, wie zum Beispiel zwischen zwei Farben auszuwählen (Bronner 2022, S. 45). Auch in der Wissenschaft, die durch ihre Progressivität und Transformationen KreativitätS voraussetzt, haben Wissenschaftler*innen nach Max Weber die Aufgabe in der sinnlosen Unendlichkeit der wahrnehmbaren Realität einen Wert zu finden und festzulegen (vgl. Weber 1995). Verzichtet der Mensch auf den kreativen Impuls und überlässt ihn den KI, so sind dystopische Auswirkungen denkbar.

In den kommenden Jahren werden wir Zeug*innen einer rasanten Entwicklung sein, in Bezug auf die Kollaboration zwischen Menschen & KI, insbesondere in den Domänen der Fiktion. KI werden in den Prozesstypen des systemischen Denkens, des Denkens in Analogien, des visuellen Denkens und teilweise des Abduktionsdenkens immer mehr Prozessschritte übernehmen. Den Rahmen für das systemische Denken werden unter Umständen die zunehmende Kommerzialisierung sowie die Ökonomie der Aufmerksamkeit bilden. Der Inhalt der kreativenL Objekte werde sich dabei auf Kombinationen der Elemente bestimmter Wissenssysteme und auf die Exploration von vorprogrammierten Möglichkeitsräumen beschränken. Auf diese Weise werden KI fast selbständig kreativenL Content produzieren.

Es bleibt die Aufgabe der menschlichen Künstler*innen & Konsument*innen, zu entscheiden, ob sie mit dem Content zufrieden sind oder die Geschwindigkeit des kreativenS Fortschritts aktiv durch ihren kreativen Impuls befördern wollen. Eine Zufriedenheit der Konsument*innen mit allem KI-produzierten Content ohne menschlichen Wertbeitrag könnte den kreativen Impuls der Konsument*innen hemmen, indem sie ihre externe Evaluation freiwillig aufgeben für den anspruchslosen Inhalt kurzfristiger Dopaminausschüttungen, die in eine triebgesteuerte Sucht führen könnten. Nur wenn Konsument*innen ihre Freizeit nutzen wollen, um den Rahmen der Unterhaltung durch das Design-Denken zu erweitern und soziale Werte durch das Meta-Denken zu reflektieren, dann behalten die Konsument*innen die Fähigkeit zum kreativenS Impuls und prägen das Verständnis eines stets progressiven Kreativitätsbegriff.

Kurz: Die Frage, wie KI-Texte kreativ werden, hängt von vielen Faktoren ab. Allerdings hängt sie heutzutage mehr denn je von den Konsument*innen ab, im System des Angebots und der Nachfrage. Das Gefühl der Erfüllung prägt die externe Evaluation der Konsument*innen. Leider entscheidet ihre Aufmerksamkeit sowie Kaufkraft über die Antwort, ob Kreativität sich im primitiven Bedürfnis anspruchsloser Unterhaltung oder in der Progressivität finden lassen sollte.

7. Schluss

Machen Maschinen Menschen menschlicher? Der Mensch definiere sich durch die Dichotomie zur Maschine – Nach Du Sautoy sei vielleicht die Fähigkeit zur Kreativität ein Alleinstellungsmerkmal des Menschen, wodurch er sich emanzipieren kann (Du Sautoy 2021, S. 298). Vielleicht könnten Maschinen dem Menschen sogar helfen aus den Denkstrukturen oder aus seinem eigenen „Algorithmus“ auszubrechen, indem die Maschinen Routinearbeiten ausführen und der Mensch sich allein auf seine kreative Impulskraft fokussiert (Du Sautoy 2021, S. 13).

In conclusion, this article has examined the question of AI’s ability to generate creative texts. Through our analysis of the example text „Harry Potter and the Portrait of what looked like a large Pile of Ash“ and our exploration of the concept of creativity, we’ve come to understand that AI’s ability to create is not only real, but it also has the potential to enhance human creativity. The question is not whether machines can be creative, but rather, how can we harness their capabilities to empower our own creativity?

It is a fascinating thought that machines might make us more human by allowing us to focus on the things that truly define us as humans, our ability to think creatively and break out of our own algorithm, the very machine-like way of thinking.

As the field of AI-generated fiction and creativity continues to evolve, we can expect to see more exciting developments in this area. And, who knows, one day AI might help us break out of our own limitations and create something truly groundbreaking and unique. The possibilities are endless and that is a truly exciting outlook.

Nur aufmerksamen Leser*innen fällt auf, dass ChatGPT hier das Pronomen „wir“ und Reflexivpronomen „uns“ verwendet. Denkt die KI wirklich, sie sei ein Mensch?

Begriffsverzeichnis