Warum ChatGPT o1 und Claude 3.5 eine stille Revolution auslösen

von | 16.03.2023 | Digital

Warum ChatGPT o1 und Claude 3.5 eine stille Revolution auslösen: Während die Medien über Nebensächlichkeiten berichten, verändert KI bereits unsere Arbeitswelt und Gesellschaft – und Deutschland schaut weiter zu.

Unsere Medien – und ja: Ich bin als freier Journalist ein Teil davon, treffe aber keine redaktionelle Entscheidungen – folgen mitunter einem merkwürdigen Prinzip. Belanglosigkeiten werden aufgebauscht („Warum hat er da gelacht?“, „Hat er wirklich das gesagt?“, „Dies und das zu sagen geht ja mal gar nicht“), die wirklich wichtigen Dinge fliegen unter dem Radar.

Die rasante Entwicklung von KI-Systemen wie ChatGPT o1, Claude 3.5 Sonnet oder Gemini 2.0 ist da ein perfektes Beispiel. Es kann kein Zweifel daran bestehen, dass diese KI-Modelle eine Revolution darstellen. Es ist keine Modeerscheinung. Es ist wirklich eine Revolution – und sie beschleunigt sich exponentiell.

Doch worüber diskutieren die Medien? Immer noch hauptsächlich darüber, ob es gut ist, wenn Schüler damit Hausarbeiten machen.

ChatGPT: Mit 100 Mio. Anwendern nach drei Monaten die am schnellsten wachsende App aller Zeiten

ChatGPT: Mit 100 Mio. Anwendern nach drei Monaten die am schnellsten wachsende App aller Zeiten

KI-Agenten übernehmen komplette Workflows

Chatbots wie ChatGPT waren gestern. Heute sprechen wir von KI-Agenten, die eigenständig komplette Arbeitsabläufe übernehmen. Sie schreiben nicht nur Protokolle oder E-Mails – sie führen ganze Projekte durch, analysieren Daten, erstellen Strategien und treffen eigenständige Entscheidungen. OpenAIs o1-Modell kann komplexe Programmieraufgaben lösen, mathematische Beweise führen und wissenschaftliche Probleme durchdenken wie ein Doktorand.

Claude 3.5 Sonnet von Anthropic kann mittlerweile Screenshots analysieren und direkt Computer-Interfaces bedienen. Das bedeutet: Die KI kann euren Bildschirm sehen, Programme öffnen, Formulare ausfüllen und Aufgaben erledigen, für die ihr normalerweise Stunden braucht. Googles Gemini 2.0 geht noch weiter und kann in Echtzeit mit Sprache, Text, Bildern und Videos arbeiten – gleichzeitig.

Während ChatGPT-4 noch maximal 128.000 Token verarbeiten konnte, schaffen die neuen Modelle bis zu 2 Millionen Token – das entspricht etwa 1.500 Seiten Text. In einem Durchgang.

Die wirklich wichtigen Fragen bleiben unbeantwortet

Doch irgendwie wollen die Massenmedien darüber nicht reden. Vermutlich, weil KI eine Blackbox ist und die Entwicklung so schnell voranschreitet, dass viele Journalisten schlicht nicht mitkommen. Das ist ein großer Fehler, denn KI-Anwendungen sind dabei, in alle Belange unseres Lebens vorzudringen. Und ich meine in alle: In den privaten Bereich, den beruflichen sowieso – und auch in den gesellschaftlichen.

Es stellen sich so viele drängende Fragen:

  • Wie funktionieren diese neuen „Reasoning“-Modelle wie o1, die tatsächlich „denken“ können?
  • Was passiert mit Millionen von Arbeitsplätzen, wenn KI-Agenten komplette Bürotätigkeiten übernehmen?
  • Wie unterscheiden wir noch zwischen menschlichen und KI-generierten Inhalten?
  • Wer kontrolliert diese KI-Systeme und deren Entscheidungen?
  • Wie abhängig wollen wir von amerikanischen und chinesischen KI-Konzernen werden?
  • Was bedeutet es, wenn KI besser programmieren, analysieren und strategisch denken kann als die meisten Menschen?
  • Wie gehen wir mit KI-Systemen um, die Menschen täuschend echt simulieren können?
  • Welche neuen Machtstrukturen entstehen durch KI-Monopole?
  • Wird Deutschland nur Konsument sein oder schaffen wir eigene KI-Souveränität?
  • Wie reguliert man etwas, was sich monatlich grundlegend verändert?
  • Welche ethischen Grenzen brauchen wir bei KI, die menschenähnlich agiert?
  • Wie viel Energie verbrauchen die riesigen KI-Rechenzentren wirklich?

Nur eine kleine Aufstellung der drängendsten Fragen. Aber wird darüber fundiert gesprochen und debattiert? Kaum. Dabei wäre das unglaublich wichtig für unsere Zukunft.

ChatGPT kann jetzt bis zu 25.000 Wörter lange Texte ausgeben

ChatGPT kann jetzt bis zu 25.000 Wörter lange Texte ausgeben

Von Multimodalität zu echten KI-Agenten

Die Fortschritte sind nicht nur rasant – sie sind revolutionär. Die neuesten KI-Modelle sind vollständig multimodal und können gleichzeitig mit Text, Bildern, Audio und Video arbeiten. Gemini 2.0 kann beispielsweise ein YouTube-Video analysieren, während es den Ton versteht und gleichzeitig Fragen dazu beantwortet.

Claude 3.5 Sonnet kann Computer-Screenshots interpretieren und direkt Aktionen ausführen. Zeigt ihm einen Screenshot eurer Buchhaltungssoftware, und es kann die entsprechenden Eingaben machen. Gebt ihm Zugriff auf euren Browser, und es erledigt Online-Shopping, Terminbuchungen oder Recherchen völlig selbstständig.

OpenAIs o1 kann „Chain-of-Thought“-Reasoning – es denkt Probleme Schritt für Schritt durch, wie ein menschlicher Experte. Komplexe mathematische Beweise, Programmieraufgaben oder strategische Planungen sind für diese KI kein Problem mehr.

Noch beeindruckender: Viele dieser Systeme können mittlerweile mit anderen APIs und Services interagieren. Sie können E-Mails versenden, Kalender verwalten, Datenbanken abfragen und sogar andere KI-Systeme steuern. Wir sprechen nicht mehr von Chatbots, sondern von echten digitalen Assistenten, die komplexe, mehrstufige Aufgaben eigenständig erledigen.

Deutschland verschläft die KI-Revolution

Während in den USA und China Milliarden in KI-Entwicklung fließen, diskutiert Deutschland immer noch hauptsächlich über Datenschutz und Regulierung. Das EU AI Act ist zwar ein wichtiger Schritt, aber er hinkt der technischen Entwicklung hoffnungslos hinterher.

Die großen deutschen Unternehmen kaufen KI-Lösungen von amerikanischen Anbietern, anstatt eigene zu entwickeln. SAP versucht es mit Business AI, Aleph Alpha kämpft ums Überleben, aber gegen OpenAI, Google oder Anthropic haben sie kaum eine Chance.

Dabei geht es um viel mehr als nur um Technologie. Es geht um digitale Souveränität, um Arbeitsplätze, um die Zukunft unserer Wirtschaft. Wer die KI-Revolution verpasst, wird abhängig von anderen – wirtschaftlich und politisch.

Was passiert, wenn jemand die Ballosn loslässt?

Was passiert, wenn jemand die Ballons loslässt?

Eine Revolution, die nicht wartet

Die KI-Revolution findet statt – mit oder ohne Medienaufmerksamkeit, mit oder ohne gesellschaftliche Debatte. Millionen von Menschen nutzen bereits täglich KI-Tools für ihre Arbeit. Unternehmen automatisieren ganze Abteilungen. Neue Geschäftsmodelle entstehen über Nacht.

Doch statt diese Entwicklungen zu durchleuchten, über Chancen und Risiken aufzuklären und gesellschaftliche Diskussionen anzustoßen, berichten unsere Medien lieber über das nächste politische Geplänkel oder den neuesten Skandal.

Das ist fahrlässig. Denn diese KI-Revolution wird unsere Gesellschaft mindestens so stark verändern wie die Erfindung des Internets – nur viel schneller. Wer jetzt nicht aufpasst und mitgestaltet, wird von den Veränderungen überrollt.

Es ist höchste Zeit, dass wir als Gesellschaft diese Diskussion führen. Bevor andere für uns entscheiden, wie unsere KI-geprägte Zukunft aussehen soll.

Zuletzt aktualisiert am 19.02.2026