Chinas KI-Modelle im Schnitt 7 Monate hinter den Frontier-Modellen aus den USA
Seit 2023 klafft eine messbare Lücke zwischen den leistungsfähigsten KI-Modellen aus den USA und China. Chinesische Modelle erreichen die Fähigkeiten ihrer US-Pendants mit einer durchschnittlichen Verzögerung von sieben Monaten, wie eine Analyse des Epoch Capabilities Index (ECI) zeigt. Die Spanne reicht von minimal vier bis maximal 14 Monaten – ein Abstand, der sich durch die gesamte Entwicklung seit Anfang 2023 zieht.
Jedes Modell, das seit 2023 an die Spitze der KI-Fähigkeiten vorgestoßen ist, stammt aus den Vereinigten Staaten. Modelle wie GPT-4, o1 und Gemini 3 Pro Preview setzen die Benchmarks, an denen sich chinesische Entwicklungen wie DeepSeek-R1, Qwen2.5-72B oder Yi-34B messen lassen müssen. Die Daten des ECI dokumentieren diese Dominanz lückenlos über einen Zeitraum von drei Jahren.
Open Weight versus proprietär
Die Lücke zwischen US- und chinesischen Modellen ähnelt stark dem generellen Gap zwischen proprietären und Open-Weight-Modellen. Diese Parallele überrascht kaum: Nahezu alle führenden chinesischen Modelle werden als Open-Weight veröffentlicht, während die US-Frontier-Modelle geschlossen bleiben. DeepSeek-V2, Qwen-14B und Baichuan2-13B stehen exemplarisch für Chinas Open-Weight-Strategie, die zwar Transparenz schafft, aber offenbar nicht mit der Performance geschlossener US-Systeme mithalten kann.
Konkrete Meilensteine verdeutlichen den Rückstand: Das erste chinesische Modell, das GPT-4 übertraf, erreichte dieses Niveau im Mai 2024 – 14 Monate nach dem Release von OpenAIs Flaggschiff im März 2023. OpenAIs o3-Modell, das im April 2025 erschien, hat bislang kein chinesisches Modell erreicht oder übertroffen. Der Abstand bleibt bestehen.

Methodik der Messung
Epoch AI berechnet die Lücke durch einen präzisen Vergleich: Für jeden Tag ermitteln die Forscher den ECI-Wert des besten chinesischen Modells und bestimmen dann, wie lange es her ist, dass das führende US-Modell einen vergleichbaren oder schlechteren Score aufwies. Modelle gelten als leistungsgleich, wenn ihre Scores maximal einen ECI-Punkt auseinander liegen. Diese Methode erlaubt eine tagesgenaue Quantifizierung des Abstands.
Die Analyse von Luke Emberson schließt bewusst die ersten Modelle aus – LLaMA-65B für die USA und Baichuan1-7B für China –, da diese vermutlich nicht die tatsächliche Frontier repräsentierten, als die ECI-Datenerhebung im Januar 2023 startete. Die Daten umfassen alle relevanten Releases bis Anfang 2026 und zeichnen ein konsistentes Bild: Die USA führen, China folgt mit sieben Monaten Verzögerung.

