Grok-4: xAI schaltet mit neuestem AI-Modell in den Aufholjagd-Modus

Erst im Februar 2025 hatten sie Grok-3 veröffentlicht, fünf Monat später kommt schon die nächste Version: Elon Musks KI-Startup xAI, dessen Tochter X (ehemals Twitter) gerade ihren CEO verloren hat, hat in der Nacht auf Donnerstag sein neuestes KI-Modell Grok-4 vorgestellt.
Zuvor kam es bereits zu mehreren Skandalen rund um xAI, unter anderem wegen umweltbelastenden Gasturbinen für den Betrieb des Colossus-Rechenzentrums und politisch unkorrekter und antisemitischer Äußerungen des Chatbots. All dem ungeachtet präsentiert Elon Musk im Kreise seiner xAI-Entwickler Grok-4 als wieder einmal besser und intelligenter.
„Das ist die schlaueste KI der Welt“, verspricht Musk bei der Präsentation vollmundig. Es sei erstaunlich, wie schnell die AI-Modelle besser werden würden. Für Grok-4 hätte man, eben mit Hilfe des mit GPUs vollgestopften Colossus-Rechenzentrums, zehn mal mehr Training durchgeführt als bei Grok-3, und 100 Mal mehr als für Grok-2. Ob Grok-4 letztendlich wirklich so gut ist wie Musk behauptet, bleibt abzuwarten – im Ranking der viel beachteten LMArena ist das neue KI-Modell von xAI noch nicht gelistet.
Introducing Grok 4, the world’s most powerful AI model. Watch the livestream now: https://t.co/59iDX5s2ck
— xAI (@xai) July 10, 2025
Sprachausgabe stark verbessert
Grok-4 soll bei wichtigen Benchmark-Tests wie etwa „Humanity’s Last Exam“ brillieren. In unterschiedlichen Vergleichen brilliert Grok-4 – natürlich – gegen die KI-Modelle der Konkurrenz, etwa o3 von OpenAI, Claude Opus 4 von Anthropic oder Gemini 2.5 Pro von Google.
Besonders stolz ist man aktuell auf die Sprachausgabe des Chatbots, mit der man etwa via Smartphone-app sprechen kann. Sie sei jetzt doppelt so schnell als bei Grok-3, was natürlichere Interaktionen zulässt, und würde fünf verschiedene Stimmen bieten. Um zu demonstrieren, wie gut Grok-4 ist, lassen Musks Entwickler die Stimmausgabe des Chatbots live eine „Ode auf Diet Coke“ singen, was die KI durchaus beeindruckend und verblüffend menschlicher Stimme auch tut.
Grok-4 soll mit einem Kontextfenster von 256.000 Token ausgestattet sein und multimodales Reasoning können – also logisches Schlussfolgerungen ziehen und Zusammenhänge erkennen können, und zwar auf Basis unterschiedlicher Eingabedaten wie Stimme, Text oder Bilder. Auch Computer-Games soll man mit dem KI-Modell sehr schnell und einfach erstellen können.
Wer die beste, umfangreichste Version von Grok-4 verwenden will, kann dies über das neue „SuperGrok Heavy“-Abo machen, das mit 300 Dollar zu Buche schlägt. Es beinhaltet fortgeschrittenes logisches Denken, Coding-Tools, besseren Support und erhöhte Nutzungsgrenzen, sowie DeepSearch und einen potenziellen „Big Brain“-Modus für Entwickler, Forscher und Unternehmen.
Coding, Agent und Videogenerierung werden nachgereicht
Dass Grok-4 aber noch nicht fertig und ausgereift ist, merkt man an der Roadmap, die Musk und sein xAI-Team am Ende vorstellen. So soll im August ein Coding-Modell gelauncht werden, um etwa mit Claude Code mithalten zu können, im September soll ein multimodaler Agent folgen („Operator“ von OpenAI lässt schön grüßen), und im Oktober soll es schließlich die Generierung von Videos möglich sein (Veo3 von Google lässt schön grüßen).
„Wir werden das Videomodell mit mehr als 100.000 GPUs trainieren“, sagt Musk. „Wir denken, dass es ziemlich spektakulär in Sachen Videogenerierung und Videoverständnis werden wird.“ Es bleibt abzuwarten, wie gut es wirklich sein wird. Bei Veo3 von Google musste man zuletzt leider mitansehen, wie das sehr gute Videomodell für rassistische Witze auf TikTok missbraucht wurde (Trending Topics berichtete).