Der Designer Beat Hochrainer hat die aktuelle Bewegungskampagne «Kommst du mit?» der Rheumaliga Schweiz entwickelt. Die fünf Bildmotive dazu hat er mithilfe künstlicher Intelligenz (KI) generiert. Im Interview erzählt er, wie er dabei vorging und was ihn an KI fasziniert.
Interview: Julia Kind
Rheumaliga Schweiz: Seit mittlerweile 19 Jahren arbeitest du für die Rheumaliga Schweiz. Inwiefern hat dies deine Wahrnehmung von Rheuma geprägt und verändert?
Beat Hochrainer: Es war mir nicht bewusst, wie viele und sehr unterschiedliche rheumatische Erkrankungen es gibt.
Die aktuelle Bewegungs-Kampagne für die Rheumaliga Schweiz hast du mithilfe von künstlicher Intelligenz (KI) kreiert. Schon sehr früh hast du dich mit KI auseinandergesetzt. Was fasziniert dich daran?
Die Möglichkeiten! Es lässt sich fast alles, was man sich vorstellen kann, als Bild darstellen – bald auch als Film. Die Auseinandersetzung mit KI ermöglicht mir aber auch einen bewussteren Blick auf unsere menschlichen Qualitäten.
Worin lagen die Herausforderungen bei der aktuellen Kampagne?
Die neuen KI-Programme haben innerhalb kurzer Zeit enorme Entwicklungsfortschritte gemacht, stecken jedoch immer noch in den Kinderschuhen. Eine Knacknuss war zum Beispiel, die fünf verschiedenen Bildmotive der Kampagne so zu generieren, dass sie sich stilistisch ähnlich sind. Dass ich dazu mit fünf unterschiedlichen KI-Werkzeugen gearbeitet habe, machte die Sache auch nicht gerade leichter…
Wie gehst du vor im kreativen Prozess?
Ich beginne mit einer Bleistiftskizze auf Papier – dies hilft mir, das Bild in meinem Kopf zu präzisieren. Anschliessend notiere ich mir dazu Details, wie beispielsweise gewünschte Perspektive, Objektiv, Brennweite, Uhrzeit, Farbtöne, etc. Das Zielbild beschreibe ich dabei zuerst grob und dann ein zweites Mal detaillierter anhand meiner zusammengestellten Liste von Prompt-Elementen. Diesen Text-Prompt (engl. für Anweisung) übersetzte ich schliesslich mit KI ins Englische und teste ihn mit verschiedenen KI-Werkzeugen. Aus der Vielzahl an generierten Bildern wähle ich dann die passendsten Ergebnisse aus, wobei ich den Text-Prompt meist noch etliche Male überarbeite, um die ausgewählten Bilder noch weiter zu verfeinern. Häufig speise ich auch Handskizzen von mir oder KI-generierte Bilder anderer KI-Werkzeuge wieder als Bild-Prompt ein. Später arbeite ich an einzelnen Bildstellen und zuletzt bearbeite ich das Bild noch konventionell mit dem Bildbearbeitungsprogramm «Photoshop».
Welche Möglichkeiten bietet KI, die es so vorher nicht gab, und worin unterscheidet sich der kreative Prozess?
Die Serie mit den fünf Kampagnen-Sujets hätte ich auch ohne KI realisieren können, doch der zeitliche Aufwand und die damit verbundenen Kosten wären um ein Vielfaches höher gewesen – und somit nicht realisierbar. Der kreative Prozess wird mit KI mehr zu einem Explorieren und Kuratieren: Man wird ständig mit fertigen Bildern konfrontiert, muss auswählen und über zahlreiche Iterationen die KI anleiten, um einen Weg zum gewünschten Zielbild zu finden.
Beat Hochrainer ist Partner der Zürcher Branding Agentur Oloid Concept. In Workshops zu KI (ars-ai.com), unter anderem an der ZHdK und der Pädagogischen Hochschule Bern, vermittelt er Wissen zum Bedienen verschiedener KI-Werkzeuge, um mit deren Hilfe einzigartige visuelle Erlebnisse zu kreieren. Dazu arbeitet er aktuell mit Midjourney, Leonardo.Ai, NewArc.ai, Adobe Firefly und Stable Diffusion.
Was macht ein gutes Bild aus?
Wenn es zu mir spricht und mich berührt, sowohl auf emotionaler als auch auf intellektueller Ebene. Als ich Japan bereiste, stand ich in einem Tempel vor einem mit Tusche auf Papier gemalten Tiger. Der Tiger wurde vor ein paar hundert Jahren schnell hingeworfen, er war leichtfüssig und kraftvoll, würdevoll, erhaben und doch irgendwie herzig. Kurz: Der Tiger war perfekt. Ich hatte beim Anblick Gänsehaut, denn bei Tusche kann man nicht korrigieren wie etwa bei Öl. Um ein solches Meisterwerk mit dieser Leichtigkeit und Gelassenheit hinzupinseln, muss man ein Leben lang üben. Mein Gänsehautmoment wurde dabei auch durch das Wissen um diesen Entstehungsprozess hervorgerufen, also nicht allein durch die Schönheit und die Qualität der finalen Tuschezeichnung. Bei KI-Bildern fehlt dieser Entstehungsprozess, auch wenn das Endresultat formal überzeugen mag.
Hast du Tipps, wie man gute Bilder mittels KI erstellt?
Wissen ist Macht und die KI ist ein Wissensverstärker. Zwar lässt sich das Bedienen der KI-Werkezeuge rasch erlernen, doch die Erfahrung macht den Unterschied: Je präziser ich beim Prompten (Anweisung an die KI) bin, desto spannendere Bilder lassen sich damit generieren. Deshalb ist mein Tipp: Üben, üben, üben! Zum Beispiel, indem ich beim Warten auf den Bus versuche, die Lichtreflexion der Halogenscheinwerfer auf dem regennassen Asphalt möglichst detailliert und trotzdem prägnant zu beschreiben. Diese Trockenübung schärft unsere Beobachtungsgabe, was fürs Erstellen guter Prompts sehr hilfreich ist. Ausserdem empfehle ich, vieles einfach mal auszuprobieren und dabei auch Dinge miteinander zu mixen, die überhaupt nichts miteinander zu tun haben.
Wo siehst du Gefahren durch die KI?
Gefahren sehe ich im Über-, aber auch Unterschätzen von KI. Durch meine intensive Auseinandersetzung mit KI kenne ich deren Stärken, aber auch Schwächen. Meine Bilder entstehen in Ko-Kreation mit KI; dabei sind meine Ideen und Expertise als Kurator derzeit immer noch unerlässlich. Gefahren sehe ich vielmehr bei der sogenannten «AGI» (Artificial General Intelligence), einer künstlichen allgemeinen Intelligenz: Ein hochautonomes KI-System, das umfassend intelligenter wäre als der Mensch und sich dazu noch physisch in unserer Welt bewegen könnte.
Wo geht aus deiner Sicht die Reise hin bei KI?
In naher Zukunft werden wir unsere eigenen Spielfilme von KI generieren lassen können. Später wird es auch Weltsimulationen in Echtzeit geben, so dass wir in unserer eigenen Welt virtuell herumwandern können. Ob uns das zufriedener machen wird?