Anthropic

Fable 5: Gebanntes KI-Modell zurück, kann nicht zum Coden verwendet werden

co-written by eustella01. Juli 2026, 22:55

Anthropic hat sein Spitzenmodell Claude Fable 5 wieder für Nutzer:innen weltweit freigeschaltet. Die US-Regierung hat die Exportkontrollen, die seit dem 12. Juni 2026 für Fable 5 und das Schwestermodell Mythos 5 galten, mit 30. Juni aufgehoben. Seit 1. Juli ist Fable 5 wieder über die Claude Platform, Claude.ai, Claude Code und Claude Cowork verfügbar. Die Rückkehr auf AWS, Google Cloud und Microsoft Foundry soll laut Anthropic so schnell wie möglich folgen.

Fable 5 ist nicht nur Anthropics bestes Modell, sondern aktuell generell das stärkste am freien Markt verfügbare LLM. Sowohl auf Arena.ai als auch auf Artificial Analysis schlägt es alle anderen KI-Modelle, ist aber auch das mit Abstand teuerste. Die Kosten mit 10 Dollar pro Million Eingabe-Token und 50 Dollar pro Million Ausgabe-Token sind herb.

Warum das Modell gesperrt war

Die Sperre ging auf einen Bericht von Amazon-Forschern zurück: Sie hatten eine Methode gefunden, die Sicherheitsvorkehrungen („Safeguards“) von Fable 5 zu umgehen, sodass das Modell Software-Schwachstellen identifizierte – in einem Fall lieferte es auch Demonstrations-Code, wie eine dieser Schwachstellen ausgenutzt werden könnte. Die US-Regierung reagierte mit sofortigen Exportkontrollen, die den Zugang für ausländische Staatsangehörige beschränkten. Weil Anthropic die Nationalität von Nutzer:innen nicht in Echtzeit verifizieren konnte, sperrte das Unternehmen beide Modelle kurzerhand für alle.

Nach eigenen Tests relativiert Anthropic den Vorfall: Auch schwächere Modelle – darunter Claude Opus 4.8, GPT-5.5 und Kimi K2.7 – hätten dieselben Schwachstellen identifizieren können, und jedes getestete Modell hätte dieselbe Exploit-Demonstration produziert. Der berichtete Jailbreak habe keine einzigartigen Offensiv-Fähigkeiten freigelegt, sondern lediglich routinemäßige defensive Cybersecurity-Arbeit betroffen.

Neuer Sicherheitsfilter trifft auch harmlose Coding-Anfragen

Als Reaktion hat Anthropic gemeinsam mit der US-Regierung einen verbesserten Sicherheits-Classifier trainiert – ein kleineres, automatisiertes KI-System, das potenziell gefährliche Cybersecurity-Anfragen erkennt und blockiert. Die im Amazon-Bericht beschriebene Technik wird damit laut Anthropic in über 99 Prozent der Fälle abgefangen.

Der Preis dafür: Der neue Filter schlägt häufiger auch bei harmlosen Anfragen an – insbesondere bei routinemäßigen Coding- und Debugging-Aufgaben. Debugging bezeichnet die systematische Suche und Behebung von Fehlern („Bugs“) in Software-Code, eine alltägliche Tätigkeit für Entwickler:innen. Wer also mit Fable 5 programmiert oder Fehler im Code sucht, muss damit rechnen, dass legitime Anfragen fälschlich als riskant eingestuft werden.

Wird eine Anfrage blockiert, werden Nutzer:innen benachrichtigt – und die Anfrage wird automatisch an das ältere Modell Claude Opus 4.8 weitergeleitet, das sie stattdessen beantwortet. Anthropic kündigt an, den Classifier weiter zu verfeinern, um echte Missbrauchsversuche besser von legitimen Anfragen zu unterscheiden und die Zahl der Fehlalarme zu senken.

Anthropic verfolgt bei Fable 5 nach eigenen Angaben bewusst einen besonders vorsichtigen Ansatz: Die Sicherheits-Classifier sind mit einer großen „Sicherheitsmarge“ konfiguriert, sodass auch Anfragen blockiert werden, die wahrscheinlich harmlos sind, aber ein geringes Restrisiko bergen. Diese Marge sei bei Fable 5 größer als bei jedem früheren Launch.

Was Fable 5 nach dem 7. Juli kostet

Aktuell läuft eine Aktionsphase: Von 1. bis 7. Juli 2026 (23:59 Uhr PT) können Nutzer:innen der Pläne Pro, Max, Team sowie Premium-Seats bei bestimmten Enterprise-Plänen Fable 5 ohne Aufpreis nutzen – allerdings nur bis zu 50 Prozent ihres wöchentlichen Nutzungslimits. Fable 5 verbraucht dieses Limit schneller als andere Claude-Modelle. Wer das Fable-5-Kontingent ausschöpft, kann entweder auf ein anderes Modell wechseln oder kostenpflichtige Usage Credits einsetzen.

Nach dem 7. Juli ist Fable 5 nicht mehr in den regulären Abo-Limits enthalten. Die Nutzung ist dann ausschließlich über Usage Credits möglich, die separat vom Abonnement abgerechnet werden. Für den Free-Plan ist Fable 5 gar nicht verfügbar, und die Nutzung über die Claude API wird ohnehin gesondert zu Standard-API-Tarifen verrechnet. Standard-Seats bei älteren Enterprise-Plänen erhalten ebenfalls keinen inkludierten Zugang – dort funktioniert Fable 5 nur, wenn die Organisation Usage Credits aktiviert hat.

Branchenweiter Standard für Jailbreaks geplant

Als Konsequenz aus dem Vorfall arbeitet Anthropic gemeinsam mit Amazon, Microsoft, Google und weiteren Partnern des „Glasswing“-Programms an einem Branchen-Framework zur Bewertung des Schweregrads von KI-Jailbreaks – analog zum etablierten CVSS-Standard für Software-Schwachstellen. Bewertet werden sollen Jailbreaks künftig nach vier Kriterien: Fähigkeitsgewinn, Breite des Fähigkeitsgewinns, Leichtigkeit der Bewaffnung und Auffindbarkeit der Technik.

Parallel vertieft Anthropic die Zusammenarbeit mit der US-Regierung: Künftig sollen Regierungsstellen bei Modellen mit nationaler Sicherheitsrelevanz erweiterten Vorab-Zugang erhalten, um Fähigkeiten und Schutzmechanismen unabhängig zu testen. Auch Mythos 5 – die Variante mit weniger Safeguards und deutlich stärkeren Cyber-Fähigkeiten – ist wieder verfügbar, allerdings nur für eine Gruppe von US-Organisationen, die die US-Regierung am 26. Juni freigegeben hat.