Bildergeschichten mit DALL∙E

Als Kind war ich in der glücklichen Situation, den Bunten Hund, also das „Magazin für Kinder in den besten Jahren“, im Abo zu beziehen. Die Kiste mit den Heften ab Band 19 (1988) hüte ich noch heute als einen Schatz. Eine durchgehende Rubrik war der ‚Erzählwettbewerb‘, für den ganzseitige Bilder von Künstler:innen wie Nikolaus Heidelbach, Franco Matticchio, Eva Muggenthaler, Henriette Sauvant oder Helga Gebert abgedruckt wurden. Diese oft fantastisch anmutenden Bilder waren der Anlass (fast hätte ich jetzt ‚der Prompt‘ geschrieben), für Kinder, sich selber Geschichten auszudenken, aufzuschreiben und an die Redaktion zu schicken. In der jeweils nächsten Ausgabe wurde dann eine Auswahl der Texte abgedruckt. Damals waren Computer noch nicht weit verbreitet. Es war sicher für alle Kinder etwas ganz Besonderes, die eigenen Texte überhaupt in Druckschrift zu sehen – und dann auch noch im Heft für alle anderen zum Nachlesen! Ich selber fand es super, Geschichten von Kindern zu lesen, die nicht viel älter oder jünger waren als ich.

Und jetzt das: Wir schreiben das Jahr 2023 und Computer denken sich Bilder zu Texten von Menschen aus. Algorithmen wie DALL∙E benötigen genauso wie Chatbots menschengemachte Texteingaben als Handlungsaufforderung (den ‚Prompt‘). Sie produzieren daraufhin aber keine Texte, sondern Bilder. Oder eher eine Anzahl ‚intelligent‘ zusammengestellter Pixel. Im Grunde könnt man es als eine KF, eine Künstliche Fantasie bezeichnen, die auf Basis eines visuellen Erfahrungsschatzes (der Trainingsdaten) auf Zuruf etwas Neues schafft. Ich habe einmal ausprobiert, was ‚sich‘ das Programm DALL∙E so ‚vorstellt‘, wenn man ihm Märchenszenen schildert.

Die Nutzung von DALL∙E kostet derzeit so etwa 10 Cent pro schriftlichem ‚Auftrag‘, wobei zu jedem Prompt dann vier Ergebnisbilder generiert werden. Beim Hersteller und auch anderswo im Internet gibt es Anleitungen und Beispiele dafür, wie so ein Prompt formuliert werden kann, um das Ergebnis in eine bestimmte Richtung zu lenken. Bei dem Bild vom traurigen König oben wollte ich darauf hinaus, dass es wie ein Gemälde aussehen sollte (‚painting‘), habe mich aber missverständlich ausgedrückt. Das Programm ‚dachte‘ wohl, ich würde Bilder oder die Aktivität des Malens als Sujet für das gewünschte Bild meinen. Dass die Königstochter neben dem König stehen sollte, wurde auch nicht verstanden – oder vielleicht als unwichtig beziehungsweise gar als ästhetisch nicht wünschenswert interpretiert?

DALL∙E zu benutzen kann süchtig machen. Es ist wie ein einarmiger Bandit, nur dass man selbst eine Art Zauberspruch formuliert, der dann irgendwie in ein Gewinnerbild oder doch zumindest in etwas Interessantes verwandelt wird. Ich finde einige der Ergebnisse sehr ansprechend und verspüre absurderweise Stolz, so als ob ich sie irgendwie selber geschaffen hätte.

Dies hier würde ich mir auch als Bild an die Wand hängen:

Hier eine niesende Königstochter:

Und hier die Ergebnisse zweier Versuche im Vergleich: Es sollte jeweils ein Bild einer großen, älteren, traurigen Frau vor einem viktorianischen Haus im ländlichen Schottland mit Feldbrocken im Vorgarten erstellt werden. Oben der Versuch mit Aquarellmaltechnik, unten ohne Angabe zum gewünschten Stil:

Soweit mir bekannt ist, ist es bislang noch nicht ohne weiteres möglich, Figuren, Stil und Farbgebung zu speichern, um dann eine visuell einheitliche Bildfolge zu generieren. Meine Versuche ergaben deshalb sehr unterschiedliche ‚Stile‘ zu ein und derselben Geschichte. Das Märchen, das ich hier darstellen wollte, ist meines Wissens noch nie illustriert worden. Ich kenne es nur auf Englisch, und bis Dr. MIMS und ich eine Übersetzung hergestellt haben, könnt ihr und können Sie sich anhand der Bilder überlegen, worum es wohl geht. Ein bisschen wie beim Bunten Hund also, mit eigener Fantasie.

Als PS noch eine andere Bilderreihe.

Als Prompt für die Bilder unten habe ich einfach ‚Fairy Tale‘ eingegeben, den englischen Begriff für das Genre ‚Märchen‘, der eigentlich eher mit ‚Feen-Geschichte‘ ins Deutsche zu übertragen wäre. Die Ergebnisse bieten Anlass zu Diskussion, finde ich. Gemeinsamer Nenner (d.h. vom Algorithmus offenbar als ‚typisch‘ für Märchen verstanden) ist eine weibliche, weiße, eher junge, meist blonde und irgendwie herausgeputzte Figur. Einmal mit Haus, zweimal mit weißen Tieren und einmal mit etwas sehr, sehr Seltsamem.

Laut Hersteller Open AI wurde DALL∙E mit möglichst wenigen Daten zu anstößigen Bildern trainiert. Zudem werden die Ergebnisse mithilfe einer Art Selbstzensur gefiltert, um potentiell verstörende Ergebnisse den Nutzer:innen nicht anzuzeigen. Außerdem versucht man, Stereotypen und Vorurteilen aktiv zu begegnen, indem nicht explizit beschriebene Menschen auf möglichst vielfältige Weise, also mit unterschiedlichen Hautfarben und Geschlechtern dargestellt werden. Bei diesem Prompt hier scheint diese Vorkehrung eher nicht angesprungen zu sein. Andererseits wäre man dann vielleicht nicht ins Nachdenken gekommen, darüber, was ‚typisch‘ ist und was ‚schön‘ … hier verweise ich gleich nochmal auf Dr. MIMS Gastbeitrag zu den Illustrationen von Henrik Schrat.