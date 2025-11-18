Launch

Googles neues AI-Modell Gemini 3 Pro schlägt bereits OpenAI, Anthropic, xAI

Google hat am Dienstag mit Gemini 3 Pro die neueste Generation seines KI-Modells vorgestellt. Nach Gemini 1, das sich auf native Multimodalität konzentrierte, und Gemini 2 mit erweiterten Fähigkeiten für logisches Denken, positioniert Google Gemini 3 als sein bisher intelligentestes Modell. Die Vorabversion von Gemini 3 Pro ist ab sofort in verschiedenen Google-Produkten sowie für Entwickler und Unternehmen verfügbar.

Und man kann sagen: Google hat abgeliefert. Aus dem Stand schlägt Gemini 3 alle anderen bereits verfügbaren KI-Modelle, unter anderem die bisherigen Spitzenreiter Grok 4.1 von xAI, Claude Sonnet 4.5 von Anthropic oder natürlich GPT-5.1 von OpenAI. Bei LMArena hat Gemini 3 Pro bereits die Spitzenposition inne:

„Übersichten mit KI werden jeden Monat 2 Milliarden Menschen angezeigt. Gemini wird von über 650 Millionen Menschen pro Monat genutzt, mehr als 70% unserer Cloud-Kund*innen verwenden unsere KI, 13 Millionen Entwickler*innen haben mit unseren generativen Modellen gearbeitet – und das ist nur ein kleiner Ausschnitt des Fortschritts, den wir beobachten“, heißt es seitens Google-CEO Sundar Pichai.

Zentrale Fähigkeiten von Gemini 3 Pro

Google brüstet sich mit folgenden Features, die Gemini 3 auszeichnen:

Schlussfolgerungen und Benchmarks:

  • Erreicht 1.501 Punkte im LMArena-Ranking (Spitzenposition)
  • Erzielt 37,5% bei „Humanity’s Last Exam“ ohne Tool-Verwendung
  • 91,9% bei GPQA Diamond-Benchmark
  • 23,4% bei MathArena Apex (neuer Bestwert für Mathematik)
  • 72,1% bei SimpleQA Verified (faktische Genauigkeit)

Multimodalität:

  • 81% bei MMMU-Pro
  • 87,6% bei Video-MMMU
  • Verarbeitet Text, Bilder, Videos, Audio und Code gleichzeitig
  • Kontextfenster von bis zu 1 Million Tokens im Input

Programmierung:

  • Elo-Wert von 1.487 (Spitzenplatz WebDev Arena)
  • 54,2% bei Terminal-Bench 2.0
  • 76,2% bei SWE-bench Verified
  • Erweiterte Zero-Shot-Generierung für komplexe Web-UIs

Agentische Funktionen:

  • Verbesserte langfristige Planung (Spitzenposition bei Vending-Bench 2)
  • Erweiterte Tool-Nutzung über längere Zeiträume
  • Fähigkeit zur Durchführung mehrstufiger Workflows

Sicherheit:

  • Geringere Ja-Sagerei („yes-saying“)
  • Höhere Widerstandsfähigkeit gegen Prompt-Injections
  • Besserer Schutz vor Cyberangriffen
  • Unabhängige Bewertungen durch Apollo, Vaultis und Dreadnode

Verfügbarkeit

Das Modell ist verfügbar über:

  • Gemini App (für alle Nutzer)
  • Google AI Pro und Ultra Abonnements (KI-Modus in der Google Suche)
  • Google AI Studio und Vertex AI (für Entwickler)
  • Google Antigravity (neue agentische Entwicklungsplattform)
  • Gemini CLI
  • Drittanbieter-Plattformen: Cursor, GitHub, JetBrains, Manus, Replit

Ein zusätzlicher „Deep Think“-Modus mit erweiterten Schlussfolgerungsfähigkeiten (41,0% bei Humanity’s Last Exam, 93,8% bei GPQA Diamond) soll nach weiteren Sicherheitstests für Google AI Ultra-Abonnenten verfügbar gemacht werden.

Unternehmen, die Gemini 3 bereits einsetzen

Produktivität und Content:

  • Box: Integration in Box AI Studio für Content-Management und Workflows
  • Presentations.AI: Automatisierte Analyse von Unternehmensinformationen für Sales-Präsentationen
  • Figma: Einbindung in Figma Make für Prototyping

Entwicklung:

  • Cursor: Integration für Frontend-Entwicklung mit verbesserten UI-Komponenten
  • GitHub: In GitHub Copilot mit 35% höherer Genauigkeit bei Software-Engineering-Aufgaben
  • JetBrains: Integration in Junie und AI Assistant mit über 50% Verbesserung gegenüber Gemini 2.5 Pro
  • Replit: Nutzung für Design-Fähigkeiten und App-Erstellung
  • Manus AI: Verbesserte Forschungs- und Web-Building-Funktionen

E-Commerce und Logistik:

  • Shopify: Einsatz für agentische KI-Tools im E-Commerce-Bereich
  • Wayfair: Umwandlung komplexer SOPs in Infografiken für Mitarbeiter

Daten und Technologie:

  • Rakuten: Alpha-Tests für multimodale Anwendungen, Transkription mehrsprachiger Meetings
  • Geotab: 10% Steigerung der Relevanz bei Code-Generierung, 30% weniger Tool-Calling-Fehler

Professional Services:

  • Thomson Reuters: Einsatz für rechtliches Reasoning und Vertragsanalyse

Asien-Pazifik:

  • WRTN Technologies: Nutzung für Story Generation, Companion Chat und B2B-Agent-Projekte, insbesondere für koreanische Sprache

Google bezeichnet Gemini 3 als wichtigen Schritt auf dem Weg zu AGI (Artificial General Intelligence) und plant, künftig weitere Modelle der Gemini 3-Serie vorzustellen.

