AI

Claude Sonnet 4.5: Anthropics neues LLM soll 30 Stunden durchgehend Coden können

Claude 4 von Anthropic. © Screenshot / Canva
Claude 4 von Anthropic. © Screenshot / Canva
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Sie verlieren keine Zeit: Nicht einmal einen Monat nach der großen Finanzierungsrunde von 13 Milliarden Dollar hat das KI-Unternehmen Anthropic heute Claude Sonnet 4.5 veröffentlicht – ein neues Sprachmodell, das laut Unternehmensangaben besonders im Bereich der Softwareentwicklung führend sein soll. Das Modell positioniert sich damit im direkten Wettbewerb zu OpenAIs GPT-5 und Googles Gemini 2.5 und will diese vor allem bei Programmierfähigkeiten schlagen.

Anthropic hat sich mit Claude schon bisher einen sehr guten Namen hinsichtlich Coding gemacht und ist in Vibe-Coding-Tools wie Lovable, Cursor oder Devin verbaut. Mit Claude Sonnet 4.5 will man diese Position nun gegen OpenAI und Google absichern (mehr dazu hier).

Leistungsdaten und Benchmarks

Nach Angaben von Anthropic erreicht Claude Sonnet 4.5 auf dem SWE-bench Verified-Test, der praktische Programmierfähigkeiten misst, Spitzenwerte unter den verfügbaren KI-Modellen. Bei der Steuerung von Computersystemen erzielt das Modell auf dem OSWorld-Benchmark einen Wert von 61,4 Prozent – eine deutliche Steigerung gegenüber dem Vorgängermodell Claude Sonnet 4, das vor vier Monaten bei 42,2 Prozent lag.

Das Unternehmen gibt an, dass das Modell bei komplexen mehrstufigen Aufgaben über mehr als 30 Stunden hinweg konzentriert arbeiten kann. Verbesserungen zeigen sich laut Anthropic auch in den Bereichen logisches Denken und Mathematik sowie bei fachspezifischem Wissen in Bereichen wie Finanzen, Recht, Medizin und Naturwissenschaften.

Produktintegration und neue Funktionen

Parallel zur Veröffentlichung des Modells hat Anthropic mehrere Produktaktualisierungen vorgenommen. In Claude Code, der Entwicklungsumgebung des Unternehmens, wurden Checkpoints eingeführt, die es Nutzern ermöglichen, zu früheren Arbeitsständen zurückzukehren. Zudem wurde eine native Erweiterung für Visual Studio Code bereitgestellt.

In den Claude-Anwendungen können Nutzer nun direkt im Gespräch Code ausführen und Dateien wie Tabellen, Präsentationen und Dokumente erstellen. Die Chrome-Erweiterung wurde für Max-Abonnenten verfügbar gemacht.

Mit dem Claude Agent SDK stellt Anthropic Entwicklern die Infrastruktur zur Verfügung, die auch für die eigenen Produkte genutzt wird. Das SDK soll den Aufbau komplexer KI-Agenten ermöglichen und enthält Lösungen für Speicherverwaltung bei langandauernden Aufgaben, Berechtigungssysteme und die Koordination mehrerer Subagenten.

Sicherheit und Ausrichtung

Anthropic bezeichnet Claude Sonnet 4.5 als das bisher am stärksten „aligned“ ausgerichtete Modell des Unternehmens. Nach eigenen Angaben wurden problematische Verhaltensweisen wie übertriebene Zustimmung, Täuschung oder das Ermutigen zu unrealistischen Vorstellungen reduziert. Besonders bei der Abwehr von Prompt-Injection-Angriffen, einer Sicherheitslücke bei KI-Systemen, seien Fortschritte erzielt worden.

Das Modell wird unter den ASL-3-Sicherheitsprotokollen von Anthropic betrieben, die Filter zur Erkennung potenziell gefährlicher Inhalte umfassen, insbesondere im Zusammenhang mit chemischen, biologischen, radiologischen und nuklearen Waffen. Anthropic gibt an, Fehlerkennungen seit der ersten Beschreibung um den Faktor zehn reduziert zu haben.

Verfügbarkeit und Preisgestaltung

Claude Sonnet 4.5 ist ab sofort über die Claude-API verfügbar. Die Preisgestaltung bleibt mit 3 US-Dollar für eine Million Eingabe-Token und 15 US-Dollar für eine Million Ausgabe-Token identisch zum Vorgängermodell Claude Sonnet 4. Zusätzlich bietet Anthropic für die nächsten fünf Tage eine Forschungsvorschau namens „Imagine with Claude“ für Max-Abonnenten an, die die Echtzeit-Softwaregenerierung demonstrieren soll.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

AI Talk

Der führende KI Podcast mit Clemens Wasner & Jakob Steinschaden
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord

Future{hacks}

Zwischen Hype und Realität
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen