Zahlen

Chinas KI-Modelle überholen US-Rivalen: Moonshot AI, MiniMax und Co. dominieren globale Token-Ökonomie

co-written by newsrooms.ai26. März 2026, 10:22

Ranking at OpenRouter. © Screenshot / Canva

Sie heißen nicht mehr GPT oder Claude, sondern GLM, MiniMax oder Kimi: Seit Februar 2026 verzeichnen chinesische KI-Modelle auf der Plattform OpenRouter mehr Token-Verbrauch als ihre amerikanischen Konkurrenten. Dieser Wandel ist kein Zufall, sondern das Ergebnis gezielter Strategien rund um Preisgestaltung, Effizienz und den wachsenden Bedarf an autonomen KI-Agenten.

Was ist OpenRouter?

OpenRouter ist die weltweit größte Aggregationsplattform für große Sprachmodelle (Large Language Models, kurz LLMs). Das Unternehmen wurde von Alex Atallah gegründet, dem ehemaligen CTO der NFT-Plattform OpenSea. Über eine einheitliche Programmierschnittstelle (API) bietet OpenRouter Entwicklern und Unternehmen Zugang zu mehr als 400 KI-Modellen von über 60 Anbietern weltweit.

Die Plattform funktioniert als eine Art Vermittler: Statt sich direkt bei OpenAI, Anthropic oder einem chinesischen Anbieter anzumelden, können Nutzer über OpenRouter auf alle Modelle zugreifen und diese miteinander vergleichen. Weil OpenRouter detaillierte Nutzungsdaten veröffentlicht, gilt die Plattform in der Branche als wichtiger Indikator für globale KI-Trends, auch wenn sie nur einen Teil des weltweiten Modellverbrauchs abbildet.

Was ist ein Token und warum ist er wichtig?

Ein Token ist die kleinste Einheit, die ein KI-Sprachmodell verarbeitet. Es kann sich dabei um ein ganzes Wort, einen Wortteil, ein Satzzeichen oder ein einzelnes Zeichen handeln. KI-Anbieter berechnen ihre Dienste in der Regel nach der Anzahl der verarbeiteten Tokens, sowohl für eingehende Anfragen (Input) als auch für generierte Antworten (Output). Der Token-Verbrauch ist damit gleichzeitig ein Maß für die Nutzungsintensität eines Modells und ein zentrales Preisschlachtfeld.

Nvidia-Chef Jensen Huang betonte zuletzt, dass die Produktion und Nutzung von Tokens die KI-Wirtschaft der Zukunft antreiben werde. Besonders relevant wird dies durch den Aufstieg sogenannter KI-Agenten: Während ein einfacher Chatbot für eine Zusammenfassung von Shakespeares „Hamlet“ etwa 30.000 Tokens benötigt, kann ein KI-Agent für eine kleinere Programmieraufgabe bis zu 20 Millionen Tokens verbrauchen.

Die Zahlen: Chinesische Modelle dominieren die Rangliste

Laut OpenRouter-Daten vom Februar und März 2026 entfallen auf chinesische Modelle rund 61 Prozent des gesamten Token-Verbrauchs unter den zehn meistgenutzten Modellen der Plattform. In der Woche vom 16. bis 22. März verzeichneten chinesische Modelle insgesamt 7,36 Billionen Tokens, ein Anstieg von 56,9 Prozent gegenüber der Vorwoche.

Modell	Anbieter	Wöchentliche Token-Nutzung	Veränderung
MiniMax M2.5	MiniMax (China)	2,45 Billionen	+197 %
Kimi K2.5	Moonshot AI (China)	1,21 Billionen	-20 %
GLM-5	Zhipu AI (China)	780 Milliarden	+158 %
DeepSeek V3.2	DeepSeek (China)	k. A.	Platz 5

Der gesamte wöchentliche Token-Verbrauch auf OpenRouter stieg auf 12,1 Billionen, ein 12,7-facher Anstieg im Vergleich zum Vorjahr. Chinesische Modelle entfielen dabei auf 5,3 der 8,7 Billionen Tokens, die von den Top-10-Modellen verbraucht wurden.

Der entscheidende Faktor: Preis

Ein zentraler Grund für den Aufstieg chinesischer Modelle ist ihr erheblicher Kostenvorteil. Die Preisunterschiede zwischen chinesischen und amerikanischen Anbietern sind erheblich:

Modell	Input (pro Million Tokens)	Output (pro Million Tokens)
MiniMax M2.5	0,30 USD	1,10 USD
Moonshot Kimi	ca. 2 bis 3 USD	ca. 2 bis 3 USD
Anthropic Claude Opus 4.6	5,00 USD	25,00 USD
Anthropic Claude Sonnet 4.5	k. A.	ca. 15,00 USD

Chinesische Modelle sind damit je nach Vergleich 10 bis 20 Mal günstiger als führende amerikanische Alternativen. Dieser Unterschied wird besonders bei KI-Agenten spürbar, die kontinuierlich große Mengen an Tokens verarbeiten.

Warum sind chinesische Modelle so günstig?

Der Kostenvorteil chinesischer KI-Unternehmen hat mehrere Ursachen. Erstens profitieren sie von günstigerer Energie, unter anderem durch massive staatliche Investitionen in erneuerbare Energien. Die chinesische Regierung hat im Arbeitsplan 2026 die Verknüpfung von Energiepolitik und KI-Wettbewerbsfähigkeit ausdrücklich als nationale Priorität verankert.

Zweitens haben chinesische Unternehmen effizientere KI-Architekturen entwickelt, etwa sogenannte „Mixture-of-Experts“-Designs, die den Rechenaufwand reduzieren. Dieser Effizienzfokus wurde auch durch US-amerikanische Exportbeschränkungen für fortschrittliche Chips befördert, die chinesische Entwickler zwangen, mit weniger Rechenleistung mehr zu erreichen.

Drittens sind Chinas LLMs eben via APIs zu sehr günstigen Preisen zu bekommen.

KI-Agenten als Wachstumstreiber

Der Boom chinesischer Modelle fällt zeitlich mit einem grundlegenden Wandel in der KI-Nutzung zusammen. Programmiertätigkeiten machen mittlerweile mehr als die Hälfte des gesamten Token-Verbrauchs auf OpenRouter aus, verglichen mit nur 11 Prozent Anfang 2025. Gleichzeitig erzeugen KI-Agenten, die eigenständig mehrstufige Aufgaben ausführen, inzwischen den Großteil der ausgegebenen Tokens.

Auch unter US-amerikanischen Start-ups ist die Verbreitung chinesischer Modelle erheblich: Der Risikokapitalgeber Martin Casado von Andreessen Horowitz schätzt, dass rund 80 Prozent junger KI-Unternehmen, die auf Open-Source-Stacks setzen, inzwischen chinesische Modelle nutzen.

Leistung auf Augenhöhe mit der Konkurrenz

Der Preisunterschied allein erklärt den Erfolg nicht vollständig. Chinesische Modelle haben technisch erheblich aufgeholt. MiniMax M2.5 erzielte auf dem SWE-Bench-Verified-Benchmark, einem Standardtest für Programmierfähigkeiten, einen Wert von 80,2 Prozent. Anthropics Claude Opus 4.6 liegt mit 80,8 Prozent nur knapp darüber. Laut der Analyseplattform Artificial Analysis haben mehrere chinesische Modelle die globale Spitzengruppe erreicht, und der Abstand zu führenden internationalen Modellen in Bereichen wie Programmierung, Multimodalität und Langtext-Verarbeitung schrumpft weiter.

Grenzen und Risiken

Der Aufstieg chinesischer Modelle verläuft nicht ohne Rückschläge. Zhipu AIs GLM-5 führte die OpenRouter-Charts im Februar kurzzeitig an, bevor die Nachfrage die verfügbare Rechenkapazität überstieg. Es kam zu Verzögerungen und Serviceausfällen, das Unternehmen musste sich öffentlich entschuldigen und die Preise anheben. Die Aktie verlor daraufhin 22 Prozent an einem einzigen Tag, was einem Marktwertsverlust von mehr als 10 Milliarden US-Dollar entsprach.