Gemini 3.5 Flash: Schneller, teuer, aber noch nicht Spitze
Eigentlich lag der Fokus auf Dingen wie dem Video-Modell Omni, der OpenClaw-Alternative Gemini Spark oder dem größten Umbau der Google-Suche seit 25 Jahren, und nicht auf neuen LLMs.
Jedoch: Google hat auf seiner Entwicklerkonferenz I/O das neue KI-Modell Gemini 3.5 Flash vorgestellt. Das Modell soll eine breite Palette von Google-Produkten antreiben, kommt jedoch mit einem spürbaren Preisanstieg und ohne den großen Leistungssprung, den viele Beobachter erwartet hatten.
Im aktuellen Ranking von Arena.ai schafft es Gemini 3.5 Flash „nur“ (mit vorläufigen Werten) auf Platz 9. Gut möglich aber, dass die „Pro“-Version, die bald kommen soll, den Sprung an die Spitze schafft, wo sich derzeit Anthropic breitgemacht hat:

Wofür Google das Modell einsetzen will
Gemini 3.5 Flash ist ab sofort in zahlreichen Google-Produkten und -Plattformen aktiv. Das Unternehmen setzt das Modell sowohl für Endverbraucher als auch für Entwickler und Unternehmen ein.
- In der Gemini-App und im KI-Modus der Google-Suche für alle Nutzer weltweit
- In der agentischen Entwicklungsplattform Google Antigravity sowie in Google AI Studio und Android Studio für Entwickler
- In der Gemini Enterprise Agent Platform und in Gemini Enterprise für Unternehmenskunden
Google betont, dass das Modell intern bereits einen deutlichen Effekt hatte. Die tägliche Token-Verarbeitung über interne KI-Entwicklertools stieg von einer halben Billion im März auf inzwischen mehr als drei Billionen pro Tag.
Deutlicher Preisanstieg gegenüber den Vorgängern
Trotz der breiten Verfügbarkeit in kostenlosen Verbraucherprodukten ist Gemini 3.5 Flash für API-Kunden erheblich teurer als seine Vorgänger. Mit einem Preis von 1,50 Dollar pro Million Input-Token und 9 Dollar pro Million Output-Token kostet das Modell dreimal so viel wie der Vorgänger Gemini 3 Flash Preview und sogar sechsmal so viel wie Gemini 3.1 Flash-Lite.
Damit nähert sich Gemini 3.5 Flash dem Preissegment von Googles eigenem Pro-Modell an, das bei 2 Dollar (Input) und 12 Dollar (Output) liegt. Der Preisanstieg fügt sich in einen branchenweiten Trend ein: Auch OpenAI und Anthropic haben ihre neuesten Modelle teurer angesetzt als die jeweiligen Vorgänger.
Google selbst positioniert das Modell trotz des Preisanstiegs als kostengünstige Alternative zu anderen Spitzenmodellen. Das Unternehmen rechnet vor, dass Unternehmen, die 80 Prozent ihrer Workloads auf Gemini 3.5 Flash verlagern, jährlich über eine Milliarde Dollar einsparen könnten.
Leistung: Verbesserungen, aber kein Durchbruch
Gemini 3.5 Flash schneidet laut Google bei fast allen Benchmarks besser ab als der Vorgänger Gemini 3.1 Pro und soll insbesondere beim agentischen Programmieren und bei komplexen, mehrstufigen Aufgaben Fortschritte gemacht haben. Besonders hervorgehoben wird die Geschwindigkeit: Das Modell soll bei der Ausgabe von Token pro Sekunde viermal schneller sein als vergleichbare Spitzenmodelle.
Dennoch handelt es sich nicht um den großen Generationssprung, den sich viele Beobachter erhofft hatten. Das Modell trägt die Versionsnummer 3.5, nicht 4, und bleibt damit in der bestehenden Modellfamilie. Die technischen Eckdaten sind solide: ein Kontextfenster von über einer Million Input-Token, bis zu 65.536 Output-Token und ein Wissensstand bis Januar 2025.
Der große Sprung kommt wohl erst mit Gemini 4
Auf der I/O-Konferenz war die Enttäuschung im Publikum spürbar, als Google-CEO Sundar Pichai ankündigte, dass das mit Spannung erwartete Modell Gemini 3.5 Pro noch nicht bereit ist.
„Ich weiß, dass ihr es kaum erwarten könnt, es in die Hände zu bekommen. Gebt uns bis nächsten Monat, um es euch zu bringen.“
Pichai nannte keine Gründe für die Verzögerung, lobte das Modell jedoch als bereits intern im Einsatz mit „deutlichen Verbesserungen in der Performance“. Gemini 3.5 Pro soll im Juni 2026 erscheinen, voraussichtlich zu einem noch höheren Preis als Flash.
Alles deutet darauf hin, dass Google die wirklich bedeutenden Neuerungen für eine künftige Gemini-4-Generation aufhebt. Gemini 3.5 Flash ist damit eher eine solide Weiterentwicklung als ein Meilenstein, die vor allem durch ihre Geschwindigkeit und breite Integration in Googles Produktwelt überzeugen soll.

