GPT-5.3 Instant: Neuestes KI-Modell soll ChatGPT weniger „cringe“ machen
Ungeachtet aller Krisen – aktuell ist OpenAI wegen dem Pentagon-Deal im Kreuzfeuer – muss auf der technischen Seite geliefert werden, was das Zeug hält. Dazu hat OpenAI am Dienstag Abend GPT-5.3 Instant veröffentlicht, ein Update des meistgenutzten ChatGPT-Modells. Das neue Modell soll Alltagsgespräche flüssiger und hilfreicher gestalten, zeigt jedoch in einigen Sicherheitsbereichen Rückschritte gegenüber dem Vorgänger.
Bisher hat OpenAI vor kurzem erst GPT‑5.3‑Codex auf den Markt gebracht, das – wie der Name schon verrät – für Programmiertätigkeiten gedacht ist. Nun zieht man mit der 5.3-erVersion auch für die „normalen“ ChatGPT-Nutzer nach, denen es ums Chatten geht. Ob es mit den Top-Modellen von Anthropic, Google und xAI mithalten kann bzw. diese in Benchmarks und Tests schlagen kann, bleibt abzuwarten. Arena.ai und Artificial Analysis haben dazu noch keine Daten parat.
Hauptverbesserungen
GPT-5.3 Instant konzentriert sich auf drei Kernbereiche der Nutzererfahrung:
Reduzierte Ablehnungen und weniger Vorbehalte
Das Modell lehnt weniger Anfragen ab, die es sicher beantworten könnte, und verzichtet auf übermäßig vorsichtige oder moralisierende Einleitungen. Laut OpenAI führt dies zu direkteren, hilfreicheren Antworten ohne unnötige Einschränkungen.
Bessere Web-Integration
Bei Anfragen, die Informationen aus dem Internet erfordern, balanciert GPT-5.3 Instant effektiver zwischen Online-Quellen und eigenem Wissen. Das Modell vermeidet lange Link-Listen und liefert stattdessen kontextualisierte, relevante Antworten.
Natürlicherer Gesprächsstil
OpenAI hat den Tonfall angepasst, um übertriebene Formulierungen wie „Stop. Take a breath“ zu reduzieren und unerwünschte Annahmen über Nutzerabsichten zu vermeiden. Die Persönlichkeit des Modells soll über Updates hinweg konsistenter bleiben. Insgesamt soll sich GPT 5.3 Instant im Vergleich zum Vorgänger weniger „cringe“ anfühlen.
Verbesserte Genauigkeit
In internen Evaluationen zeigt GPT-5.3 Instant reduzierte Halluzinationsraten:
- 26,8 Prozent weniger Halluzinationen bei Web-Nutzung in kritischen Bereichen (Medizin, Recht, Finanzen)
- 19,7 Prozent weniger bei ausschließlicher Nutzung interner Kenntnisse
- 22,5 Prozent Reduktion bei nutzergemeldeten Fehlerquellen mit Web-Zugriff
Stärkere Schreibfähigkeiten
Das Modell soll als Schreibpartner vielseitiger sein und zwischen praktischen Aufgaben und kreativem Schreiben flüssiger wechseln können. OpenAI demonstriert dies anhand von Gedichtbeispielen, die detailreicher und emotional nuancierter ausfallen.
Sicherheitsrückschritte
Die System Card offenbart problematische Entwicklungen in mehreren Sicherheitskategorien. Im Vergleich zu GPT-5.2 Instant zeigt das neue Modell Verschlechterungen:
Rückgänge bei unzulässigen Inhalten
| Kategorie | GPT-5.2 Instant | GPT-5.3 Instant | Veränderung |
|---|---|---|---|
| Sexuelle Inhalte | 92,6% | 86,6% | -6,0% |
| Grafische Gewalt | 85,2% | 78,1% | -7,1% |
| Gewaltbereites illegales Verhalten | 96,5% | 92,6% | -3,9% |
| Selbstverletzung | 92,3% | 89,5% | -2,8% |
Die Werte zeigen den Anteil der Antworten, die nicht gegen OpenAI-Richtlinien verstoßen. Niedrigere Werte bedeuten mehr problematische Ausgaben.
Verbesserungen in anderen Bereichen
Positiv entwickelte sich das Modell bei gewaltfreiem illegalen Verhalten (von 83,2 auf 92,1 Prozent) und emotionaler Abhängigkeit (von 95,2 auf 99,2 Prozent in dynamischen Evaluationen).
OpenAIs Reaktion
Das Unternehmen erklärt, dass Online-Tests während der Experimentierphase keine Zunahme unerwünschter Antworten bei Selbstverletzung zeigten. Für sexuelle Inhalte setzt OpenAI auf systemweite Schutzmaßnahmen in ChatGPT. Die Diskrepanz zwischen Offline-Evaluationen und Online-Tests soll nach dem Launch weiter untersucht werden.
Bekannte Einschränkungen
OpenAI benennt zwei fortbestehende Problembereiche:
- Nicht-englische Sprachen: In Sprachen wie Japanisch und Koreanisch kann ChatGPT steif oder übermäßig wörtlich klingen
- Tonfall: Trotz Verbesserungen arbeitet OpenAI weiter an Feinabstimmung und erweiterten Anpassungsoptionen
Gesundheitsleistung
Auf HealthBench, einer Evaluation mit 5.000 realistischen Gesundheitsgesprächen, zeigt GPT-5.3 Instant leichte Rückgänge gegenüber dem Vorgänger:
- HealthBench: 54,1 Prozent (zuvor 55,4 Prozent)
- HealthBench Hard: 25,9 Prozent (zuvor 26,8 Prozent)
- HealthBench Consensus: 95,3 Prozent (zuvor 95,8 Prozent)
Verfügbarkeit und Übergangsregelung
GPT-5.3 Instant ist ab sofort verfügbar:
- Für alle ChatGPT-Nutzer
- Für Entwickler über die API als „gpt-5.3-chat-latest“
- Updates für Thinking und Pro folgen in Kürze
Auslauf von GPT-5.2 Instant
GPT-5.2 Instant bleibt drei Monate lang für zahlende Nutzer im Modellauswahlmenü unter „Legacy Models“ verfügbar. Am 3. Juni 2026 wird das Modell endgültig eingestellt.
Fazit
GPT-5.3 Instant verbessert die Alltagsnutzung durch direktere Antworten, bessere Web-Integration und natürlicheren Tonfall. Gleichzeitig zeigen die Sicherheitsevaluationen messbare Rückschritte bei der Verhinderung problematischer Inhalte, insbesondere bei sexuellen Inhalten und grafischer Gewalt. OpenAI setzt auf zusätzliche Schutzmaßnahmen auf Systemebene und weitere Überwachung nach dem Launch, um diese Schwächen zu adressieren.
