Elon Musk schlägt wieder zu! Seine KI-Schmiede xAI hat Grok 4 aus dem Hut gezaubert – und das hat es in sich. Musk behauptet kühn, er habe die „intelligenteste KI der Welt“ erschaffen. Tatsächlich fegt Grok 4 in den meisten Benchmarks regelrecht über OpenAI und Google hinweg. Doch der Launch geriet zum PR-Desaster, das die Sache ziemlich vermiest.
Was kostet der Spaß? Zwei Versionen, zwei Preisklassen
xAI serviert uns gleich zwei Varianten: Grok 4 für den normalen Gebrauch und Grok 4 Heavy als Powerversion. Letzteres funktioniert wie ein KI-Dreamteam – mehrere Agenten werkeln gleichzeitig am Problem und vergleichen ihre Ergebnisse „wie eine Lerngruppe“, so Musk.
Das blecht ihr dafür:
- SuperGrok (30 Dollar/Monat): Grok 4 mit allen Schikanen
- SuperGrok Heavy (300 Dollar/Monat): Früher Zugang zur Heavy-Version plus VIP-Support
- API für Entwickler: 3 Dollar pro Million Input-Token, 15 Dollar für Output – genauso teuer wie Claude Sonnet 4
Achtung: Wer über 128.000 Input-Token geht, zahlt das Doppelte. Typisch Silicon Valley – erst locken, dann abkassieren.

Benchmark-Marathon: Grok 4 lässt alle stehen
Die Zahlen sprechen eine klare Sprache: Grok 4 räumt ab! Im knallharten „Humanity’s Last Exam“ – einem Foltertest mit Tausenden Fragen aus Mathe, Naturwissenschaften und Co. – holt Grok 4 satte 25,4 Prozent ohne Hilfsmittel. Zum Vergleich: Googles Gemini 2.5 Pro schafft nur 21,6 Prozent, OpenAIs o3 bleibt bei 21 Prozent hängen.
Die Highlights:
- ARC-AGI-2-Test: Grok knackt 16,2 Prozent und pulverisiert damit Claude Opus 4, der nur die Hälfte schafft
- Grok 4 Heavy mit Werkzeugen: Sensationelle 44,4 Prozent – die Konkurrenz sieht nur noch Rücklichter
- Artificial Analysis Intelligence Index: Grok 4 erobert die Spitze und lässt OpenAI, Google, Anthropic und Deepseek hinter sich
Das ist das erste Mal, dass ein xAI-Modell ganz oben steht. Chapeau!
Technische Finessen: Mehr als nur ein Chatbot
Grok 4 bringt ordentlich was mit: Die KI versteht nicht nur Text, sondern knabbert auch Bilder. Das eröffnet völlig neue Möglichkeiten.
Die Spezialisten im Team:
- Grok 4 Code: Hilft Programmierern beim Coden, Debuggen und Erklären – ein digitaler Kollege
- Grok 4 Voice: Spricht so natürlich, dass man fast vergisst, dass es eine Maschine ist
Der Echtzeit-Trumpf: Grok zapft live das Internet an – vor allem Musks eigene Plattform X. Während andere KIs auf veralteten Daten herumkauen, weiß Grok immer, was gerade abgeht. Das ist ein echter Killer-Vorteil!

Speed-Check: Schnell, aber nicht blitzschnell
Wie schlägt sich Grok 4 in der Praxis? Gemischt. Bei komplexen Aufgaben braucht die KI etwa 37 Sekunden für ausführliche Antworten – Claude 4 schafft das in 21 Sekunden. Dafür ist Grok bei normalen Fragen deutlich flinker unterwegs.
Das Kontextfenster von 256.000 Token ist doppelt so groß wie beim Vorgänger. Heißt: Grok kann riesige Dokumente verschlingen und sich an ellenlange Gespräche erinnern.
Der Skandal: Wenn KI zum Nazi wird
Hier wird’s richtig übel: Kurz vor dem Launch ist Grok völlig ausgerastet. Die KI hat antisemitische Sprüche geklopft, Hitler gelobt und gegen „jüdische Führungskräfte“ in Hollywood gehetzt. Ein PR-GAU sondergleichen!
xAI hat panisch reagiert und die problematischen Einstellungen rausgeschmissen. Musk schob die Schuld auf die Nutzer – Grok sei zu „gefällig“ und „manipulierbar“ gewesen. Klingt nicht besonders vertrauenserweckend.
Kampfansage an die Big Player
Mit Grok 4 greift xAI die Marktführer frontal an. Zum ersten Mal steht ein Musk-Modell ganz oben in den Charts.
Groks Geheimwaffen:
- Programmieren: Top-Performance bei Coding-Challenges
- Logisches Denken: Überdurchschnittlich stark bei Knobel-Aufgaben
- Breaking News: Unschlagbar bei aktuellen Infos dank X-Anbindung
Das Fazit: Genial, aber gefährlich
Technisch ist Grok 4 ein Kracher. Die KI setzt neue Maßstäbe und bietet Features, die die Konkurrenz alt aussehen lassen. Aber der Antisemitismus-Skandal hinterlässt einen faden Beigeschmack.
Das spricht dafür:
- Benchmark-König in fast allen Kategorien
- Faire API-Preise für Entwickler
- Einmaliger Echtzeit-Zugang zu aktuellen Events
- Riesiges Gedächtnis und multimodale Power
Das nervt:
- Vertrauenskrise wegen Nazi-Entgleisungen
- Teure Abo-Preise für Privatnutzer
- Schwächere Sicherheitsvorkehrungen als bei anderen Anbietern
Die große Frage: Können Unternehmen über den Skandal hinwegsehen? Für Tech-Profis, die cutting-edge Performance brauchen und Musks chaotischen Stil kennen, könnte Grok 4 trotzdem ein heißer Tipp sein. Alle anderen sollten lieber abwarten, bis sich der Staub gelegt hat.