Ist das Kunst? Wenn KI aus Wörtern Bilder macht

von Jörg Schieb | 22.06.2022 | Digital

Ein Waschbär im Weltraum: Das Bild wurde von KI erstellt

Künstliche Intelligenz (KI) entwickelt sich rasant weiter. KI-Systeme können sehr gut analysieren – aber mitunter auch gut synthetisieren. Es gibt bereits KI-Systeme, die erzeugen auf Knopfdruck skurrile Motive: Es reicht, ein paar Begriffe einzugeben – schon präsentiert die KI ein Bild. Das KI-System ist aus gutem Grund so nicht für die Allgemeinheit zugänglich – eine Testversion aber sehr wohl.

Ein Koalabär, der einen „Dunking“ hinlegt – also hoch springt und einen Basketball im Korb versenkt. Ein Waschbär im Weltraum, die umgebenden Sterne reflektieren effektvoll im gläsernen Kopfschutz. Und dann auch noch Römer aus der Zeit von Christus Geburt, die Gladiatorenkämpfe mit ihrem Smartphone fotografieren… Man kommt aus dem Staunen gar nicht mehr heraus.

KI erzeugt Fußball spielende Giraffen

Soziale Netzwerke derzeit mit KI-Bildern geflutet

Derzeit geistern auffallend viele absurd wirkende Aufnahmen und Bildern in Sozialen Netzwerken wie Twitter oder Instagram. Die Bilder hat keine Kunststudenten für ein Projekt erstellt – sondern eine Maschine. Eine Künstliche Intelligenz (KI), die auf Knopfdruck solche Bilder erzeugt. Der Benutzer lässt ein paar Begriffe fallen – etwa: „Jesus im Sportwagen“ –, und die KI erschafft Bilder, die im weitesten Sinn den Begriffen entsprechen.

Viele Aufnahmen, die derzeit auf Twitter kursieren, sehen artifiziell und verrückt aus, aber auch irgendwie interessant. Wer mag, kann solche Aufnahmen selbst erstellen lassen. Denn es gibt seit kurzem eine KI-Version, die sich kostenlos im Browser von jedem aufrufen und nutzen lässt: Einfach zwei, drei Begriffe eingeben (in englischer Sprache) – und los geht’s.

Jeder kann kostenlos KI-Bilder erzeugen lassen

Je nach aktueller Auslastung erscheint nach wenigen Sekunden, spätestens nach einigen Minuten eine Bilder-Kachel mit mehreren Bildern, die zu den eingegebenen Begriffen passen. Ich habe „Giraffe plays football“ eingegeben – und ja: Im weitesten Sinn ist die Aufgabe erfüllt. Allerdings sind die Aufnahmen meilenweit davon entfernt, perfekt zu sein – oder technisch derart brillant, dass man sich als Betrachter täuschen lassen könnte.

Doch das ist nur einem Sicherheitsmechanismus zu verdanken. Denn die im Netz frei zugängliche Mini-Version von „Dall-E“ – das sich „Dali“ spricht, wie der berühmte Maler –, ist eine Miniversion mit abgespecktem Funktionsumfang einer viel leistungsfähigeren KI, die durchaus bemerkenswerte Aufnahmen erzeugen kann: Dall-E2 ist das eigentliche von Wissenschaftlern entwickeltes KI-System, das man mit Begriffen füttert – und Bilder zu erzeugen vermag.

Auch Googles KI erzeugt selbständig Bilder

OpenAI entwickelt leistungsfähiges KI-System

Dall-E ist ein im Vergleich zur Miniversion im Web 27-Mal leistungsfähigeres KI-Modell von Open AI, einer von Microsoft und Elon Musk finanzierten Forschungseinrichtung, die die Möglichkeiten Künstlicher Intelligenz auslotet.

Diese, technisch viel ausgereiftere und interessantere Software dürfen bislang allerdings nur wenige ausgewählte Forscher und Künstler ausprobieren und benutzen. Es geht darum zu ergründen, was KI „versteht“ – und welche Bilder KI erzeugen kann. Mit dem großen Dall-E2 mit vollem Funktionsumfang lassen sich beeindruckende Fake-Aufnahmen herstellen, etwa Avocados, die sich sonnen, Tiere in Raumanzügen, selbst künstlerische Stilrichtungen lassen sich damit imitieren.

Dall-E2 erzeugt hochwertige Aufnahmen

Was Dall-E2 erzeugt, sieht nicht nach KI-Müll aus – sondern nach kunstvoll und auch technisch durchaus respektablen Aufnahmen. Die KI ist sogar in der Lage, auf Anweisung ein Hund in einem Bild durch eine Katze zu ersetzen oder überhaupt Fotos zu manipulieren – schnell, effektiv und mit beeindruckender Qualität.

Das ist auch der Grund, wieso Dall-E2 nur ausgewählten Nutzern zur Verfügung steht: Mit einem solchen System lassen sich zweifellos Aufnahmen anfertigen – der Phantasie sind keine Grenzen gesetzt –, die so echt wirken, das sie Verwirrung stiften könnten. Schlimmstenfalls auch Verwerfungen.

Schon jetzt experimentieren User mit Motiven, die verstörend sein können (etwa einen ans Kreuz genagelten Ronald McDonald). Aber genau das ist die Aufgabe von OpenAI: Herauszufinden, was technisch heute möglich ist – und wo wir Schranken und Regeln brauchen, was mit KI eigentlich gemacht werden darf.

Auch Google entwickelt an einem Text-zu-Bild-System namens „Imagen“: Auch dieses KI-System erzeugt nach Eingabe von Begriffen eigenständige Bilder. Nach Ansicht von Googles Ingenieuren sogar weiterentwickelt und besser.