Kiro: Fehler des KI-Coding-Tool in Verbindung mit Ausfällen bei Amazon Web Services
Amazons Cloud-Sparte AWS hat in den vergangenen Monaten mindestens zwei Ausfälle erlitten, die mit Fehlern bei eigenen KI-Tools in Verbindung stehen. Dies hat bei einigen Mitarbeitern Zweifel an der Strategie des Unternehmens geweckt, diese Coding-Assistenten großflächig einzusetzen, wie die Financial Times berichtet.
Das ist ein durchaus relevanter Vorfall, da es sich bei Amazon Web Services um die größte Cloud der Welt handelt. Fällt sie aus, reißt sie in der Regel zahlreiche andere Web-Dienste auf der ganzen Welt mit sich.
Vorfall im Dezember mit Kiro-Tool
Im Dezember kam es zu einer 13-stündigen Unterbrechung eines AWS-Systems, nachdem Ingenieure dem KI-Coding-Tool Kiro erlaubt hatten, bestimmte Änderungen vorzunehmen. Laut vier mit der Angelegenheit vertrauten Personen kam das sogenannte „agentische“ Tool, das eigenständig Aktionen im Auftrag von Nutzern durchführen kann, zu dem Schluss, dass die beste Vorgehensweise darin bestehe, „die Umgebung zu löschen und neu zu erstellen“.
Das betroffene System ermöglicht es AWS-Kunden, die Kosten ihrer Dienste zu analysieren. Amazon veröffentlichte intern eine Nachbetrachtung über den Ausfall.
Zweiter Vorfall in kurzer Zeit
Mehrere Amazon-Mitarbeiter bestätigten gegenüber der Financial Times, dass dies bereits der zweite Vorfall innerhalb weniger Monate war, bei dem ein KI-Tool des Konzerns im Zentrum einer Dienstunterbrechung stand. Ein leitender AWS-Mitarbeiter erklärte: „Wir haben in den vergangenen Monaten bereits mindestens zwei Produktionsausfälle gesehen. Die Ingenieure ließen den KI-Agenten ein Problem ohne Eingriff lösen. Die Ausfälle waren klein, aber völlig vorhersehbar.“
Bei dem früheren Vorfall war laut drei Mitarbeitern das Amazon Q Developer-Produkt beteiligt, ein KI-gestützter Chatbot zur Unterstützung von Ingenieuren beim Schreiben von Code.
Amazons Stellungnahme
Amazon wies die Kritik zurück und bezeichnete die Beteiligung der KI-Tools als „Zufall“. Das Unternehmen erklärte, dass „dasselbe Problem mit jedem Entwickler-Tool oder manuellen Aktion auftreten könnte“.
Amazon betonte, dass es sich in beiden Fällen um „Benutzerfehler, nicht um KI-Fehler“ gehandelt habe. Es gebe keine Hinweise darauf, dass Fehler mit KI-Tools häufiger aufträten als bei anderen Werkzeugen.
Der Konzern beschrieb den Dezember-Vorfall als „extrem begrenztes Ereignis“, das nur einen einzelnen Dienst in Teilen Festlandchinas betroffen habe. Der zweite Vorfall habe keinen „kundenorientierten AWS-Dienst“ beeinträchtigt.
Sicherheitsmaßnahmen und Berechtigungen
Mitarbeiter berichteten, dass die KI-Tools des Unternehmens als Erweiterung eines Operators behandelt und mit denselben Berechtigungen ausgestattet würden. In den beiden Fällen hätten die beteiligten Ingenieure keine Genehmigung einer zweiten Person benötigt, bevor sie Änderungen vornahmen, wie es normalerweise üblich sei.
Amazon erklärte, dass das Kiro-Tool standardmäßig „vor jeder Aktion um Autorisierung bittet“. Der im Dezember-Vorfall involvierte Ingenieur habe jedoch „umfassendere Berechtigungen als erwartet gehabt“. Es handle sich um ein „Problem der Benutzerzugriffskontrolle, nicht um ein Problem der KI-Autonomie“.
Hintergrund zu AWS und KI-Tools
AWS ist für 60 Prozent der Betriebsgewinne von Amazon verantwortlich. Das Unternehmen entwickelt und implementiert KI-Tools, darunter „Agenten“, die auf Basis menschlicher Anweisungen eigenständig Aktionen durchführen können. Wie viele große Technologieunternehmen versucht Amazon, diese Technologie an externe Kunden zu verkaufen.
Das Kiro-Tool wurde im Juli eingeführt. Amazon erklärte, der Coding-Assistent würde über das sogenannte „Vibe Coding“ hinausgehen und stattdessen Code auf Basis eines Satzes von Spezifikationen schreiben.
Einige Amazon-Mitarbeiter äußerten sich skeptisch über den Nutzen von KI-Tools für den Großteil ihrer Arbeit, angesichts des Fehlerrisikos. Sie fügten hinzu, dass das Unternehmen ein Ziel gesetzt habe, wonach 80 Prozent der Entwickler KI mindestens einmal pro Woche für Coding-Aufgaben nutzen sollen. Die Akzeptanz werde genau verfolgt.
Gegenmaßnahmen nach dem Vorfall
Amazon teilte mit, dass nach dem Dezember-Vorfall „zahlreiche Schutzmaßnahmen“ implementiert worden seien. Dazu gehören verpflichtende Peer-Reviews und Mitarbeiterschulungen. Das Unternehmen betonte, dass es ein starkes Kundenwachstum für Kiro verzeichne und dass Kunden und Mitarbeiter von Effizienzgewinnen profitieren sollten.

