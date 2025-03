Es schlägt sowohl Grok-3 von xAI als auch GPT-4.5 von OpenAI: Ja genau, die Welt hat ein neues bestes KI-Modell, und es kommt aus dem Hause Google. Mit Google Gemini 2.5 Pro stellt der Internet-Konzern bzw. eigentlich seine KI-Tochter Deepmind sein bisher „intelligentestes“ LLM vor. Ganz nach dem mittlerweile bekannten „Reasoning“-Prinzip überlegt das AI-Modell, bevor es antwortet – was auch mal länger dauern kann.

Gemini 2.5 basiert auf dem Konzept der „denkenden Modelle“, die in der Lage sind, ihre Gedanken vor einer Antwort zu analysieren. Dies führt zu einer höheren Genauigkeit und besseren Leistung. Im Gegensatz zu traditionellen KI-Systemen, die sich auf Klassifikation und Vorhersagen beschränken, legt Gemini 2.5 Wert auf tiefgehendes logisches Denken, kontextbezogene Analyse und fundierte Entscheidungsfindung.

Google hat bereits mit Gemini 2.0 Flash Thinking den Grundstein für diese Denkfähigkeiten gelegt und baut nun mit Gemini 2.5 auf diesen Fortschritten auf. Durch eine verbesserte Basismodellarchitektur und optimierte Nachbearbeitung erreicht die neue Generation ein höheres Leistungsniveau und ist besser geeignet, komplexe Probleme zu lösen, heißt es aus dem Konzern.

Gemini 2.5 Pro: Führend in Benchmarks

Gemini 2.5 Pro Experimental ist speziell für anspruchsvolle Aufgaben entwickelt worden und überzeugt durch herausragende Ergebnisse in den Bereichen Mathematik, Wissenschaft und Programmierung. Es führt nicht nur die LMArena-Rangliste an, sondern zeigt auch überlegene Fähigkeiten bei gängigen Benchmarks wie GPQA und AIME 2025.

Ein hervorzuhebender Erfolg ist die Leistung bei „Humanity’s Last Exam“, einem Datensatz, der von Experten entwickelt wurde, um die Grenzen menschlichen Wissens abzubilden. Hier erzielt Gemini 2.5 Pro ohne zusätzliche Testtechniken wie Mehrheitsabstimmung eine Spitzenleistung von 18,8 %.

Hier die Vergleichs-Benchmarks, die Google selbst herausgegeben hat:

Hier die aktuelle Bestenliste der Chatbot Arena:

Verbesserte Programmierfähigkeiten

Die Programmierleistung von Gemini 2.5 stellt einen deutlichen Fortschritt gegenüber der Vorgängerversion dar. Das Modell kann nicht nur visuell ansprechende Webanwendungen erstellen, sondern auch komplexe Code-Transformationen durchführen und bestehenden Code effizient bearbeiten. Auf SWE-Bench Verified, einem Industriestandard für die Bewertung agentischer Codefähigkeiten, erreicht Gemini 2.5 Pro satte 63,8 %. Ein Beispiel zeigt die Fähigkeit des Modells, aus einer einfachen Textaufforderung ausführbaren Code für ein Videospiel zu generieren – eine Demonstration seiner praktischen Anwendungsmöglichkeiten.

Multimodalität und erweiterter Kontext

Gemini 2.5 setzt auf native Multimodalität und eine erweiterte Kontextlänge von bis zu einer Million Token (zwei Millionen sind in Planung). Dies ermöglicht dem Modell, große Datensätze zu verarbeiten und Informationen aus verschiedenen Quellen wie Texten, Bildern, Audio und Videos zu kombinieren.

Verfügbarkeit

Gemini 2.5 Pro Experimental ist ab sofort in Google AI Studio sowie in der Gemini-App für Nutzer der kostenpflichtigen „Advanced“-Version verfügbar. In den kommenden Wochen wird das Modell auch über Vertex AI zugänglich sein. Google plant zudem eine Preismodell-Einführung, um den Einsatz von Gemini 2.5 Pro für skalierte Produktionsanwendungen zu erleichtern.

Das Tempo, das Google derzeit vorlegt, ist durchaus beeindruckend – immerhin konnte man Grok-3 von xAi und GPT-4.5 von OpenAI ziemlich schnell kontern. Damit ist der Weg frei für Gemini 3.0, das bereits auf der Google-Hauskonferenz I/O im Mai vorgestellt werden könnte.