OpenAI hat diese Woche seine komplett überarbeitete ChatGPT Images Version vorgestellt – und diesmal ist es mehr als nur ein Update. Mit dem neuen GPT Image 1.5 Modell verändert sich grundlegend, wie wir mit KI-generierten Bildern arbeiten.
Ich habe mir die neue Version angeschaut und verglichen, was sie gegenüber Googles Nano Banana wirklich kann.
Was ist neu bei ChatGPT Images?
Die wichtigste Änderung: Geschwindigkeit. OpenAI verspricht eine bis zu 4-fach schnellere Bildgenerierung. Das klingt erstmal nach einer technischen Spielerei, macht in der Praxis aber den entscheidenden Unterschied. Statt minutenlang zu warten, seht ihr eure Ergebnisse jetzt in Sekunden.
Noch wichtiger ist aber die präzise Bearbeitung. Das alte Problem kennt jeder, der schon mal mit KI-Bildtools gearbeitet hat: Du willst nur eine Kleinigkeit ändern – sagen wir, die Farbe eines Hemds – und das gesamte Bild wird neu interpretiert. Plötzlich sieht die Person anders aus, der Hintergrund hat sich verändert, und die Beleuchtung stimmt nicht mehr.
GPT Image 1.5 löst dieses Problem durch kontextbewusste Bearbeitung. Das Modell versteht jetzt, was im Bild zusammengehört: Beleuchtung, Komposition, Gesichtszüge bleiben erhalten, wenn du nur Details änderst. Das ist der Unterschied zwischen einem Spielzeug und einem Werkzeug, das ihr produktiv nutzen könnt.
Ein weiterer Pluspunkt: Alle eure generierten Bilder landen automatisch unter „My images“ (chatgpt.com/images). Schluss mit dem mühsamen Durchsuchen alter Chats, um diese eine perfekte Variante von letzter Woche wiederzufinden.

Verfügbarkeit: Kostenlos oder Plus?
Die gute Nachricht: ChatGPT Images steht allen zur Verfügung – Free, Plus, Team, Enterprise. Allerdings gibt es Unterschiede bei den Limits und Wartezeiten. Free-User müssen mit längeren Wartezeiten und täglichen Limits rechnen. Wer regelmäßig damit arbeiten will, kommt um ChatGPT Plus (20 Dollar/Monat) nicht herum.
Google Nano Banana: Die Konkurrenz schläft nicht
Parallel zu OpenAI hat Google im August mit „Nano Banana“ (offiziell: Gemini 2.5 Flash Image) ein beeindruckendes Gegenmodell veröffentlicht. Auf der Ranking-Plattform LMArena dominiert es aktuell die Bildbearbeitungs-Kategorie – mit über 5 Millionen Stimmen.
Die Stärke von Nano Banana liegt in der Charakterkonsistenz. Wenn ihr eine Person in verschiedenen Szenen, Posen oder Outfits darstellen wollt, ist Nano Banana unschlagbar. Die Gesichtszüge, die Proportionen, die Details – alles bleibt identisch. Das ist Gold wert für Comic-Serien, Storyboards oder wenn ihr Produkte mit immer demselben Modell zeigen wollt.
Auch die Multi-Bild-Fusion funktioniert bei Google extrem gut. Ihr könnt mehrere Bilder hochladen und sie nahtlos verschmelzen lassen – ein Objekt aus Bild A in die Szene von Bild B einfügen, mit natürlichen Übergängen und korrekter Beleuchtung.
Nano Banana ist direkt in der Gemini App verfügbar und ebenfalls in einer kostenlosen Variante nutzbar. Für die Pro-Features (höhere Auflösung, mehr Kontrolle über Kamerawinkel und Beleuchtung) braucht ihr Google AI Plus.
Der direkte Vergleich
ChatGPT Images punktet bei:
- Geschwindigkeit – merklich schneller in der Generierung
- Kreative Transformationen – Stilwechsel, konzeptionelle Änderungen
- Workflow-Integration – alles im Chat, kein Tool-Wechsel nötig
- Textdarstellung – endlich scharfe, lesbare Schrift in Bildern
Nano Banana glänzt bei:
- Charakterkonsistenz – niemand macht das besser
- Szenenverständnis – erkennt Objektbeziehungen und physikalische Logik
- Präzise Lokale Bearbeitung – gezielt einzelne Bereiche ändern
- Multi-Bild-Komposition – mehrere Bilder nahtlos verschmelzen
Praktische Tipps zum Testen
Bei ChatGPT Images solltet ihr ausprobieren:
- Iterative Bearbeitung: Generiert ein Bild und lasst es dann Schritt für Schritt verfeinern. Zum Beispiel: „Erstelle ein Café-Interieur“ → „Füge eine Pflanze links hinzu“ → „Mach das Licht wärmer“ → „Setze eine Person an den Tisch rechts“. Beobachtet, wie das Modell wirklich nur die gewünschten Änderungen macht.
- Text in Bildern: Probiert Poster, Buchumschläge oder Werbeanzeigen mit Text. Schreibt konkret: „Erstelle ein Filmplakat mit dem Titel ‚Sommernacht‘ in gelber Schrift“.
- Stilübertragung: Ladet ein Foto hoch und experimentiert mit Stilen: „Verwandle das in einen handgezeichneten Anime-Stil“ oder „Mach daraus ein Ölgemälde im Stil der Impressionisten“.
Bei Nano Banana (in Gemini) solltet ihr testen:
- Charakterkonsistenz: Erstellt eine Person und lasst sie dann in verschiedenen Situationen zeigen. „Zeige dieselbe Person beim Joggen“, „Jetzt in einem Business-Anzug“, „Jetzt am Strand“. Die Konsistenz ist verblüffend.
- Virtuelle Anprobe: Ladet ein Foto von euch hoch und probiert verschiedene Outfits: „Zieh mir eine rote Lederjacke an“ – funktioniert erstaunlich natürlich.
- Szenen-Fusion: Kombiniert Elemente aus verschiedenen Bildern: „Setze den Hund aus Bild 1 auf das Sofa in Bild 2“.
Meine Einschätzung
Wir erleben gerade einen Wendepunkt. KI-Bildbearbeitung wird vom experimentellen Feature zum produktiven Werkzeug, das ihr täglich nutzen könnt – ohne stundenlanges Einarbeiten in komplizierte Software.
Der Clou: Beide Tools setzen auf natürliche Konversation statt komplizierter Prompt-Syntax. Ihr beschreibt einfach, was ihr wollt, und die KI versteht den Kontext. Das ist der eigentliche Durchbruch.
Die Wahl zwischen ChatGPT Images und Nano Banana hängt von eurem Use Case ab:
Wählt ChatGPT Images, wenn ihr schnell verschiedene Konzepte durchspielen wollt, kreative Transformationen braucht oder viel mit Text in Bildern arbeitet.
Wählt Nano Banana, wenn ihr konsistente Charaktere über mehrere Bilder hinweg braucht, komplexe Bildkompositionen erstellen oder präzise lokale Bearbeitungen vornehmen wollt.
Für die meisten Alltagsaufgaben sind beide Tools inzwischen „gut genug“ – ein Meilenstein, der vor einem Jahr noch Science-Fiction war. Meine Empfehlung: Testet beide ausgiebig. Die kostenlosen Versionen reichen, um ein Gefühl dafür zu bekommen, welches Tool besser zu eurer Arbeitsweise passt.
Die Zukunft der Bildbearbeitung liegt nicht mehr in Photoshop-Ebenen und komplexen Filtern. Sie liegt im Dialog mit einer KI, die versteht, was ihr meint. Und diese Zukunft ist jetzt verfügbar.