Hintergrund

KI-Agenten kaufen selbst nach: Auto-Reload bei Claude, ChatGPT und Perplexity als Kostenfalle

co-written by newsrooms.ai19. Mai 2026, 11:11

Robot in Auto-Refill-Mode. © Nano Banana 2 / Trending Topics

Mit dem Vormarsch agentischer KI-Tools haben Anthropic, OpenAI und Perplexity ein neues Abrechnungsmodell etabliert: Funktionen, die nach Aufbrauchen des im Abo enthaltenen Credit-Budgets automatisch zusätzliche Credits einkaufen. Anthropic spricht von „Extra Usage“ mit „Auto-Reload“, OpenAI von „Automatic Reload“ beziehungsweise „Auto Recharge“, Perplexity von „Auto-Refill“.

Die Mechanik ist in allen drei Fällen ähnlich: Eine hinterlegte Zahlungsmethode wird belastet, sobald ein definierter Mindeststand unterschritten ist – ohne erneute Bestätigung pro Aufladung. Was als Komfortfunktion gegen Workflow-Unterbrechungen positioniert wird, entwickelt sich bei agentischen Workloads schnell zur Kostenfalle. Denn bei intensiverer Nutzung vor allem von agentischen Fähigkeiten, die weit mehr Token als normale Suchanfragen kosten, sind die im Abo enthaltenen Credits schnell aufgebraucht – und um weiterzuarbeiten, verlangt die KI dann nach neuen Credits. Oder macht einfach erst morgen weiter.

Perplexity: Auto-Refill mit Cap bis zu 2.000 Dollar

Perplexity Max kostet 200 Dollar pro Monat und enthält 10.000 Credits pro Monat sowie einen einmaligen Launch-Bonus von 20.000 Credits, der nach 30 Tagen verfällt. Die Auto-Refill-Funktion ist standardmäßig deaktiviert. Bei Aktivierung kauft Perplexity automatisch Credits nach, sobald das Guthaben unter 500 Credits (rund fünf Dollar) fällt. Der Default-Monats-Cap liegt bei 200 Dollar. Zusätzlich existiert ein separater Account-Spending-Cap, der standardmäßig bei 200 Dollar pro Abrechnungszeitraum liegt und auf bis zu 2.000 Dollar erhöht werden kann. Nicht verbrauchte Monats-Credits verfallen am Ende des Abrechnungszeitraums.

Wie schnell agentische Aufgaben das Standardbudget sprengen, zeigt ein in der Community dokumentierter Lauf: Ein Reddit-Nutzer bat Perplexity Computer, eine 280.000 Zeilen umfassende Python-Codebasis auf Bugs zu prüfen. Der Lauf dauerte rund 40 Minuten und verbrauchte zunächst 15.000 Credits, kletterte schließlich auf 21.000 Credits und verbrannte weitere 2.000 Credits beim Versuch, das Ergebnis zu GitHub zu pushen. Das entspricht mehr als dem Doppelten der monatlichen Standard-Allokation – für eine einzige Aufgabe.

Anthropic: Extra Usage mit Tageslimit von 2.000 Dollar

Bei Anthropic erlaubt die „Extra Usage“-Funktion Nutzern von Pro-, Max-, Team- und Enterprise-Plänen, nach Erreichen der im Abo enthaltenen Limits zu API-Tarifen weiterzuarbeiten. Die Funktion umfasst laut Help Center einen Monats-Spending-Cap, Auto-Reload-Settings, die bei Unterschreiten eines Schwellenwerts automatisch Credits nachkaufen, sowie Usage Alerts. Das tägliche Redemption-Limit liegt bei 2.000 Dollar. Extra Usage gilt einheitlich für Claude, Cowork und Claude Code.

Für Team- und Enterprise-Pläne ist die Logik auf Organisationsebene strukturiert: Owner können in den Organization Settings Extra Usage aktivieren, Auto-Reload mit definiertem Mindestguthaben einschalten und einen organisationsweiten Monats-Spending-Limit setzen. Für Claude Code hält Anthropic fest, dass Auto-Reload nicht über das Terminal-Tool, sondern im Claude Console-Account verwaltet wird und alle Übergänge zur API-Credit-Nutzung explizite Nutzerzustimmung erfordern.

In der Community sind allerdings Fälle dokumentiert, in denen die Abrechnungslogik nicht wie beschrieben funktionierte. Ein auf GitHub eingereichter Bug-Report eines Pro-Nutzers schildert, dass sein Extra-Usage-Budget auf null Euro entleert wurde, wobei 5,91 Euro gegen ein 5-Euro-Monatslimit verbucht wurden – obwohl die Plan-Limits noch Kapazität anzeigten und Auto-Reload deaktiviert war.

OpenAI: Auto-Recharge bei API-Setup standardmäßig aktiv

Bei OpenAI existiert die Auto-Reload-Logik in mehreren Produktebenen. Plus- und Pro-Nutzer von Codex können in den Settings unter Usage Auto Top-up aktivieren. Fällt das Credit-Guthaben unter den gewählten Mindeststand, wird automatisch nur jener Betrag eingekauft, der nötig ist, um es auf das Zielguthaben zurückzubringen. Auto Top-up gilt für das geteilte Credits-Guthaben über Codex und Sora hinweg.

Für ChatGPT Business ist die Funktion auf Workspace-Ebene umgesetzt. Automatic Reload soll Unterbrechungen verhindern, wenn ein Workspace Credits für Codex-Aktivität verbraucht. Nutzer setzen einen Minimum Balance und einen Target Balance. Über ein optionales Monthly Recharge Limit lassen sich Auto-Reload-Käufe deckeln – bleibt das Feld leer, sind unbegrenzte automatische Aufladungen pro Monat möglich. Codex-Seats in ChatGPT Business haben keine fixe monatliche Seat-Gebühr, benötigen aber Workspace-Credits für jede Aktivität.

Bei der API-Anbindung weicht das Default-Verhalten von den Consumer-Plänen ab: Auto Recharge ist beim initialen Setup standardmäßig aktiviert. Wer keine automatischen Top-ups will, muss die Option vor Bestätigung des initialen Credit-Kaufs aktiv deaktivieren. OpenAI dokumentiert zudem eine Einschränkung der eigenen Abrechnungsgenauigkeit: Aufgrund der Komplexität der Billing-Systeme kann es zu Verzögerungen kommen, bis der Zugang nach Verbrauch aller Credits gekappt wird. Dieser Überschussverbrauch erscheint als negativer Credit-Saldo und wird vom nächsten Credit-Kauf abgezogen.

Warum agentische KI die Ökonomie verändert

Die Funktionen sind kein Zufall, sondern eine direkte Reaktion auf den Architekturwandel der Tools. Solange KI als Chatbot funktionierte – Frage, Antwort, ein paar tausend Token –, war der Verbrauch berechenbar. Agentische Systeme arbeiten autonom über längere Zeiträume, zerlegen Aufgaben in Sub-Tasks und führen sie parallel aus. Claude-Code-Sessions können das Fünf-Stunden-Zeitfenster eines Max-Abos in unter 90 Minuten erschöpfen. Multi-Agent-Setups mit drei oder vier parallel laufenden Coding-Agents verbrauchen kein Vielfaches eines Chats, sondern eine Größenordnung mehr.

GitHub hat aus dieser Dynamik bereits Konsequenzen gezogen und stellt Copilot zum 1. Juni 2026 auf nutzungsbasierte Abrechnung mit AI Credits um – mit der expliziten Begründung, dass agentische Nutzung „zum Default wird“ und das Flat-Fee-Modell den Compute-Anforderungen nicht mehr standhält. Sam Altman hat öffentlich erklärt, OpenAI müsse sich zu einer „AI inference company“ entwickeln – eine Anerkennung dessen, dass agentische Nutzung ein grundlegend anderes ökonomisches Modell erfordert.

Strukturell unterscheidet sich diese Mechanik von klassischen Pay-per-Use-Modellen, weil das System selbst über die Tiefe und damit die Kosten der Ausführung entscheidet – nicht ausschließlich der Nutzer über die Häufigkeit seiner Anfragen. Genau hier liegt das Kostenrisiko von Auto-Reload: Eine einzige fehlgeleitete Agenten-Schleife, ein zu breit definierter Task oder ein Multi-Agent-Setup, das in eine Sackgasse läuft, kann den Monats-Cap innerhalb von Minuten ausschöpfen.