OpenAI

GPT-5.5-Cyber teilweise stärker als Claude Mythos, Bann gibt es aber keinen

co-written by newsrooms.ai24. Juni 2026, 08:09

OpenAI hat die vollständige Version seines auf Cybersicherheit spezialisierten KI-Modells GPT-5.5-Cyber vorgestellt. Das Modell ist Teil des unternehmenseigenen Cyber-Defense-Programms „Daybreak“ und richtet sich ausdrücklich nicht an die breite Öffentlichkeit, sondern an verifizierte Sicherheitsfachleute. Während Anthropics konkurrierende Spitzenmodelle Mythos 5 und Fable 5 derzeit auf Anordnung der US-Regierung offline sind, läuft OpenAIs neues Modell unter staatlich abgestimmten Zugangskontrollen weiter.

Dass GPT-5.5 möglicherweise besser – und somit aus Cybersecurity-Sicht auch gefährlicher – ist als Claude Mythos, darauf haben Expert:innen bereits hingewiesen (Trending Topics berichtete).

Was das Modell kann

GPT-5.5-Cyber soll Sicherheitsteams helfen, Software-Schwachstellen schneller zu finden und zu beheben. Laut OpenAI verschiebt sich der Engpass in der Cyberabwehr derzeit: Nicht mehr das Auffinden von Schwachstellen sei das Hauptproblem, sondern deren tatsächliche Behebung. Das Modell ist darauf ausgelegt, große Codebasen zu analysieren, nachzuvollziehen, ob verwundbarer Code überhaupt erreichbar ist, Schwachstellen in kontrollierten Umgebungen zu validieren sowie Patches zu entwickeln und zu testen – mit dem Menschen als finaler Kontrollinstanz.

Im Benchmark CyberGym, der an der UC Berkeley entwickelt wurde und prüft, ob KI-Agenten bekannte Schwachstellen in Softwareumgebungen reproduzieren können, erreicht das neue Modell nach Angaben von OpenAI 85,6 Prozent. Zum Vergleich nennt das Unternehmen 81,8 Prozent für das Standardmodell GPT-5.5 – nach eigenen Angaben der höchste CyberGym-Wert, den OpenAI bislang für ein einzelnes Modell gemessen hat. Auf zwei weiteren Benchmarks meldet das Unternehmen Zugewinne: 39,5 Prozent (gegenüber 25,95 Prozent bei GPT-5.5) auf ExploitGym, das prüft, ob Agenten bekannte Schwachstellen in funktionierende Exploits umsetzen können, sowie 69,8 Prozent (gegenüber 63,1 Prozent) auf SEC-bench Pro.

Der Vergleich mit Anthropic

Brisant ist der Vergleich mit dem direkten Konkurrenten. Auf der CyberGym-Rangliste liegt OpenAIs neues Modell mit 85,6 Prozent vor Anthropics Mythos 5, das auf 83,8 Prozent kommt. Anthropics breiter verfügbares Modell Claude Opus 4.7 erreicht 73,1 Prozent.

Ein Abstand von weniger als zwei Prozentpunkten wäre für sich genommen kaum bemerkenswert. Der Kontext ist es allerdings: Mythos 5 und Fable 5 wurden am 12. Juni infolge einer Eil-Exportkontrollanordnung der Trump-Regierung abgeschaltet, die mit Gründen der nationalen Sicherheit begründet wurde. Auslöser war den Berichten zufolge ein Jailbreak – eine Technik, mit der sich die eingebauten Sicherheitsbeschränkungen eines Modells umgehen lassen. Da Anthropic keine zuverlässige Möglichkeit hatte, die Nationalität seiner Nutzer im großen Maßstab zu überprüfen, deaktivierte das Unternehmen beide Modelle weltweit für alle. Stand 23. Juni waren Fable 5 und Mythos 5 weiterhin offline – ohne offizielles Wiederherstellungsdatum von Anthropic oder dem US-Handelsministerium.

OpenAI verfolgt bei der Markteinführung einen ähnlich restriktiven Zugangsansatz, hat ihn aber vorab mit der US-Regierung abgestimmt. GPT-5.5-Cyber ist nur für geprüfte Sicherheitsfachleute verfügbar; vor dem Start führte OpenAI eigenen Angaben zufolge Tests mit Bundesbehörden durch, darunter das Center for AI Standards and Innovation (CAISI) und das Office of the National Cyber Director (ONCD). Für die meisten Verteidiger sei jedoch GPT-5.5 in Kombination mit „Trusted Access for Cyber“ und dem Werkzeug Codex Security der geeignete Ausgangspunkt; die Cyber-Variante richte sich an jene, deren autorisierte Arbeit die fortgeschrittensten Fähigkeiten und ein „permissiveres“ Verhalten des Modells erfordere.

Partnerschaften und Ökosystem

Parallel zum Modell baut OpenAI sein Cyber-Ökosystem aus. Das Daybreak Cyber Partner Program soll es Sicherheitsanbietern ermöglichen, GPT-5.5 in ihre eigenen Produkte und Dienste zu integrieren, während der direkte Modellzugang bei den Partnern bleibt. Zu den genannten Partnern zählen unter anderem CrowdStrike, Cisco, Cloudflare, Palo Alto Networks, IBM, Akamai, Check Point, Fortinet, SentinelOne und Zscaler.

Auf staatlicher Ebene hat OpenAI nach eigenen Angaben im vergangenen Monat „Trusted Access for Cyber“-Partnerschaften mit Australien, Kanada, Frankreich, Deutschland, Japan, der Republik Korea sowie EU-Institutionen wie der EU-Cybersicherheitsagentur ENISA geschlossen; auch mit der britischen Regierung bestehe eine Zusammenarbeit. Hinzu kommt die Initiative „Patch the Planet“, die gemeinsam mit Trail of Bits, HackerOne und weiteren Akteuren Sicherheitslücken in weit verbreiteter Open-Source-Software schließen soll – nach Unternehmensangaben haben sich mehr als 30 Projekte beteiligt, darunter cURL, Go, Python und pyca/cryptography. Das Werkzeug Codex Security habe seit dem Start im März über 30 Millionen Commits in mehr als 30.000 Codebasen gescannt und mehr als 500.000 behobene Schwachstellen verzeichnet.

Hintergrund: der frühere Pentagon-Streit

Der jetzige Kontrast zwischen den beiden Unternehmen knüpft an eine frühere Auseinandersetzung an, die zeitlich und sachlich vom Juni-Exportbann zu trennen ist. Bereits Ende Februar und Anfang März 2026 waren Verhandlungen zwischen Anthropic und dem US-Verteidigungsministerium über den Einsatz von Anthropics Modellen in klassifizierten Umgebungen gescheitert. Anthropic bestand auf roten Linien – kein Einsatz für autonome Waffensysteme und keine Massenüberwachung im Inland. In der Folge wies Präsident Trump die Bundesbehörden an, Anthropics Technologie über einen Übergangszeitraum von sechs Monaten auszuphasen; Verteidigungsminister Pete Hegseth stufte das Unternehmen als „Supply-Chain-Risiko“ ein. Anthropic bezeichnete diese Einstufung als „rechtswidrig und politisch motiviert“.

Wenige Stunden später gab OpenAI einen eigenen Vertrag über den Einsatz seiner Modelle in klassifizierten Umgebungen bekannt. CEO Sam Altman räumte ein, der Abschluss sei „definitiv überstürzt“ gewesen, betonte aber, OpenAI habe nicht einfach jene Bedingungen akzeptiert, die Anthropic abgelehnt hatte. Nach Darstellung von OpenAI nannte Anthropic spezifische vertragliche Verbote als Bedingung, während OpenAI sich auf bestehende Gesetze und Richtlinien stützte – ein Ansatz, den Kritiker als rechtlich weicher bewerteten. Beobachter wie das MIT Technology Review werteten dies so, dass Anthropic einen moralisch strengeren, OpenAI einen pragmatischeren Kurs verfolgt habe. Anthropic, das zuvor über einen 200-Millionen-Dollar-Vertrag mit dem Verteidigungsministerium verfügte und dessen Claude-Modelle bereits in bestimmten klassifizierten Systemen eingebettet waren, kehrte später an den Verhandlungstisch zurück.

Die im Juni verhängten Exportkontrollen gegen Mythos 5 und Fable 5 sind ein gesonderter Vorgang. Anthropic verhandelt nach eigenen Angaben weiterhin mit dem Handelsministerium und klagt parallel gegen die Trump-Regierung. OpenAI verweist seinerseits auf einen „laufenden Dialog“ mit der US-Regierung über seinen Cyber-Ansatz und kommende Modellveröffentlichungen.