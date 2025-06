OpenAI hat eine – wieder einmal – eine Aktualisierung seiner KI-Modellpalette angekündigt: Das neue o3-pro-Modell ist ab sofort für Pro- und Team-Nutzer in ChatGPT sowie über die API verfügbar und ersetzt dabei das bisherige o1-pro-Modell. Parallel dazu führt das Unternehmen erhebliche Preissenkungen ein, die insbesondere für Entwickler von Interesse sind.

Eine der auffälligsten Änderungen betrifft die Kostenstruktur für API-Nutzer. OpenAI senkt die Preise für o3-pro um 87 Prozent gegenüber dem Vorgängermodell o1-pro. Zusätzlich wird auch das Standard-o3-Modell um 80 Prozent günstiger angeboten. Diese Preisreduktion positioniert die o3-Serie nach Angaben von OpenAI als eines der kosteneffizientesten Frontier-Reasoning-Modelle auf dem aktuellen Markt.

Zuletzt kam massive Kritik an Reasoning-Modellen (LRMs) auf. Denn ein wissenschaftliches Paper von Apple kam kürzlich zum dem Schluss, dass diese angeblich „denkenden“ LRMs gar nicht so schlau sind und in mancherlei Hinsicht gar ihren „normalen“ LLM-Geschwistern unterlegen seien. Apple bietet seine hauseigenen KI-Modelle zudem seit dieser Woche Entwicklern von Apps kostenlos an – möglicherweise ein Mitgrund, warum OpenAI nun auf Preis-Dumping setzt.

Technische Eigenschaften und Einsatzgebiete

Das o3-pro-Modell basiert auf demselben Grundmodell wie o3, wurde jedoch speziell für längeres „Denken“ und besonders verlässliche Antworten optimiert. Wie bereits sein Vorgänger o1-pro zeigt o3-pro seine Stärken insbesondere in den Bereichen Mathematik, Naturwissenschaften und Programmierung, was durch akademische Benchmarks bestätigt wird.

Ein wesentlicher Unterschied zu o1-pro liegt in der Tool-Integration. o3-pro verfügt über Zugriff auf verschiedene Werkzeuge, die ChatGPT zu einer vielseitigeren Plattform machen:

Websuche

Datei-Analyse

Visuelles Verständnis

Python-Code-Ausführung

Memory-Funktion für personalisierte Antworten

Performance und Bewertungen

In einigen Expertenbewertungen schnitt o3-pro durchgehend besser ab als das Standard-o3-Modell, besonders in den Kategorien Wissenschaft, Bildung, Programmierung, Business und Schreibassistenz. Die Bewerter vergaben konsistent höhere Bewertungen für Klarheit, Vollständigkeit, Befolgung von Anweisungen und Genauigkeit.

Akademische Evaluierungen zeigen, dass o3-pro sowohl o1-pro als auch o3 übertrifft. Besonders hervorzuheben ist die „4/4-Zuverlässigkeitsbewertung“ von OpenAI, bei der ein Modell nur dann als erfolgreich gilt, wenn es eine Frage in allen vier Versuchen korrekt beantwortet.

Auch nicht unwesentlich: o3 ist unabhängigen Benchmarks zufolge OpenAIs bestes KI-Modell (vor GPT-4o und GPT-4.5), auch wenn es etwas hinter den Top-Modellen von Google zurück liegt. Hier das aktuelle Ranking der LMArena:

Geschwindigkeit vs. Zuverlässigkeit

Aufgrund der integrierten Tools benötigt o3-pro in der Regel mehr Zeit für die Antwortgenerierung als o1-pro. OpenAI empfiehlt daher den Einsatz des Modells primär für komplexe Fragestellungen, bei denen Verlässlichkeit wichtiger ist als Geschwindigkeit und eine Wartezeit von mehreren Minuten akzeptabel ist.

Verfügbarkeit und Einschränkungen

o3-pro ist ab sofort für Pro- und Team-Nutzer verfügbar, während Enterprise- und Edu-Nutzer in der darauffolgenden Woche Zugang erhalten. Das Modell ersetzt o1-pro in der Modellauswahl von ChatGPT.

Derzeit bestehen jedoch einige technische Einschränkungen:

Temporäre Chats sind aufgrund eines technischen Problems deaktiviert

Bildgenerierung wird nicht unterstützt (Nutzer müssen auf GPT-4o, o3 oder o4-mini ausweichen)

Canvas-Funktionalität ist momentan nicht verfügbar

Sicherheit und Dokumentation

Da o3-pro auf demselben Grundmodell wie o3 basiert, gelten die gleichen Sicherheitsrichtlinien. Detaillierte Informationen zu Sicherheitsaspekten sind in der offiziellen Systemkarte zu o3 dokumentiert.

Die drastischen Preissenkungen und die verbesserte Performance könnten o3-pro zu einer attraktiven Option für Entwickler und Unternehmen machen, die auf leistungsstarke KI-Modelle für komplexe Anwendungsfälle angewiesen sind. Gleichzeitig verdeutlicht die Einführung den intensiven Wettbewerb im Bereich der Large Language Models, in dem Preisdruck und Leistungssteigerungen Hand in Hand gehen.