ChatGPT4 ist da: Warum sind die Medien nicht voll davon?

von Jörg Schieb | 16.03.2023 | Digital

ChatGPT4 ist da: OpenAI hat das neue Modell seines KI-basierten Chatbots an den Start gebracht – und ihm reichlich neue Funktionen spendiert. Obwohl im Prinzip noch in den Kinderschuhen, leistet ChatGPT4 Erstaunliches. Doch in den Medien: Schweigen.

Unsere Medien – und ja: Ich bin als freier Journalist ein Teil davon, treffe aber keine redaktionelle Entscheidungen – folgen mitunter einem merkwürdigen Prinzip. Belanglosigkeiten werden aufgebauscht („Warum hat er da gelacht?“, „Hat er wirklich ‚Paschas‘ gesagt?“, „Dies und das zu sagen geht ja mal gar nicht“), die wirklich wichtigen Dingen fliegen unter dem Radar.

Der überraschende Start von ChatGPT4 diese Woche ist da ein schönes Beispiel. Es kann kein Zweifel daran bestehen, dass ChatGPT und vergleichbare Chatbots (derer es mittlerweile schon viele gibt) eine Revolution darstellen. Es ist keine Modeerscheinung. Es ist wirklich eine Revolution.

Doch worüber diskutieren die Medien? Ob es gut ist, wenn Schüler damit die Hausarbeiten machen.

ChatGPT: Mit 100 Mio. Anwendern nach drei Monaten die am schnellsten wachsende App aller Zeiten

ChatGPT: Viele Fragen, kaum Antworten

Chatbots wie ChatGPT und alle KI-Lösungen, die noch kommen, stellen alles auf den Kopf. Schon bald werden sie eigenständig im Büro Protokolle schreiben, Zusammenfassungen von Dialogen oder E-Mail-Threads erstellen, sie werden automatisch auf E-Mails antworten, auf Knopfdruck Textvorschläge für Repliken, Angebote, Werbetexte, Posts, Newsletter, Motivationsschreiben – oder auch Kündigungen erstellen. Dauert alles nur Sekunden – und ist für ChatGPT und Co. ein Klacks.

ChatGPT3 konnte maximal 3000 Wörter ausgeben – bei ChatGPT4 sind es schon 25.000.

Doch irgendwie wollen die Massenmedien darüber nicht reden. Vermutlich, weil KI eine Blackbox ist. Wie funktioniert sowas nur? Das ist ein großer Fehler, denn KI-Anwendungen sind dabei, in alle Belange unseres Lebens vorzudringen. Und ich meine in alle: In den privaten Bereich, den beruflichen sowieso – und auch in den gesellschaftlichen.

Es stellen sich so viele Fragen:

Wie funktionieren solche KI-Systeme eigentlich?
Wie kommen die Antworten und Texte zustande?
Was verändert sich dadurch beim Suchen und beim Medienkomsum?
Was ist noch wahr, wenn KI alles täuschend echt erzeugen kann?
Wie sieht es aus mit dem Urheberrecht?
Wer haftet bei Fehlentscheidungen oder Plagiaten?
Wer steuert, was diese Maschinen sagen/texten?
Welche neuen Konzerne entstehen da? (Meiner Ansicht nach derart große, dass Google, Apple und Meta daneben wir Zwerge wirken werden)
Werden wir in Deutschland nur Zaungast sein? (Danach sieht es aus)
Wer kann, was soll reguliert werden?
Welche Arbeitsplätze sind gefährdet, welche entstehen neu?
Wie verändert sich Lernen – und wie halten wir Schritt mit der Welt?
Wie viel Energie kostet das alles eigentlich – und was spart es ein?

Nur eine kleine Aufstellung. Aber wird darüber gesprochen und debattiert? Nein. Dabei wäre das unglaublich wichtig.

ChatGPT kann jetzt bis zu 25.000 Wörter lange Texte ausgeben

ChatGPT4 versteht Bilder

Die Fortschritte sind rasant. Das neue ChatGPT4 zum Beispiel ist nun multimodal. Es „versteht“ Bilder, so wie es Artikel oder Geschichten sinngemäß erfasst und Fragen dazu beantworten kann. Wer ChatGPT4 ein Bild zeigt, auf dem ein Smartphone zu sehen ist mit VGA-Stecker und fragt: „Was stimmt hier nicht?“, sagt die KI: Der falsche Stecker. Ich habe der KI ein Bild gezeigt mit einem Baby am Autosteuer: „Babys sitzen nicht im Fahrersitz!“

Noch beeindruckender: Ein Bild mit einem Kind, das 100 Ballons in der Hand hält, die mit Gas gefüllt sind. „Was passiert, wenn ich die Bänder durchschneide?“ Die KI weiß auch das: „Dann fliegen die Ballons davon.“

This upgrade has some major advancements,

Including now understanding the 'context' of images.

🧵 (2/10) pic.twitter.com/PxFDBQ1iNE

— 🇦🇺 Alex is Building (@AlexIsBuilding) March 15, 2023

Wenn das nicht beeindruckend ist. Das setzt voraus, dass das System nicht nur erfasst, was im Bild zu sehen ist (Kind, Ballons), sondern auch „versteht“, was da los ist – bis hin zu Wenn-dann-Konstruktionen. Wenn das Kind die Ballons loslässt oder die Kordel durchgeschnitten wird, dann fliegen die Ballons weg. Richtig.

Eine Revolution unter dem Radar

Doch ChatGPT4 kann noch mehr. Ingenieure haben es gezeigt: Eine Zeichnung von einer Webseite. Hochgeladen. Und Sekunden später ist der HTML-Code für die Webseite da. Eine funktionierende Webseite – basierend auf einer Zeichnung.

Noch könne nicht alle die neuen Funktionen ausprobieren. Sie stehen zahlenden Plus-Kunden zur Verfügung (aber da auch noch nicht die Bildeingabe), oder über die Programmierschnittstelle (API) oder Bing. Aber überall limitiert: Die dafür benötigten Ressourcen sind enorm. Deshalb muss das verfügbare Kontingent fair verteilt werden.

ChatGPT kann also nicht nur Lesen und Schreiben, sondern nun auch Sehen. Nicht mehr lange, und es kann auch Sprechen und Zuhören (die Funktion zum Zuhören gibt es eigentlich schon bei OpenAI, sie heißt „Whisper“). Und Bilder generiere kommt auch bald (auch das ist mit Dall-E schon vorhanden).

Doch all das findet in den regulären Medien kaum statt. Eine Revolution unter dem Radar.

Was passiert, wenn jemand die Ballosn loslässt?