Baidu: Chinesische Search-Riese launcht AI-Modell ERNIE 5.0 gegen GPT-5

Baidu hat auf dem Baidu World 2025 Event sein neuestes Foundation Model ERNIE 5.0 präsentiert. Das proprietäre Modell verarbeitet und generiert nativ Inhalte über Text, Bilder, Audio und Video hinweg. Anders als das kürzlich veröffentlichte Open-Source-Modell ERNIE-4.5-VL-28B-A3B-Thinking, das unter Apache 2.0 Lizenz verfügbar ist, bleibt ERNIE 5.0 geschlossen und läuft ausschließlich über die ERNIE Bot Website und die Qianfan Cloud-Plattform-API für Enterprise-Kunden.
CEO Robin Li formuliert die Strategie so: „Wenn man AI internalisiert, wird sie zu einer nativen Fähigkeit und transformiert Intelligenz von einem Kostenfaktor zu einer Quelle der Produktivität.“
Baidu positioniert ERNIE 5.0 als direkten Konkurrenten zu OpenAIs GPT-5 und Googles Gemini 2.5 Pro. In den während des Events präsentierten Benchmark-Slides übertrifft oder erreicht ERNIE 5.0 Preview die westlichen Top-Modelle in multimodalem Reasoning, Dokumentenverständnis und bildbasiertem QA. Besonders stark schneidet das Modell bei strukturiertem Dokumentenverständnis ab: Auf OCRBench, DocVQA und ChartQA – drei Benchmarks für Dokumentenerkennung, Verständnis und strukturierte Datenanalyse – schlägt ERNIE 5.0 laut Baidu sowohl GPT-5-High als auch Gemini 2.5 Pro. Bei der Bildgenerierung erreicht das Modell laut interner GenEval-basierter Evaluation gleichauf mit Googles Veo3. Unabhängige Verifizierungen dieser Ergebnisse stehen allerdings noch aus.
Was man derzeit noch nicht sagen kann, ist, wie sich ERNIE 5.0 in unabhängigen Tests schlägt. So ist das neue KI-Modell etwa noch nicht bei LMArena gelistet.
Pricing zwischen Budget und Premium
Beim Pricing positioniert sich Baidu im Mittelfeld. ERNIE 5.0 kostet 0,85 Dollar pro Million Input-Tokens und 3,40 Dollar pro Million Output-Tokens – deutlich günstiger als GPT-5.1 (1,25/10,00 Dollar), Claude Opus 4.1 (15,00/75,00 Dollar) oder Grok 4 (3,00/15,00 Dollar), aber spürbar teurer als das eigene ERNIE 4.5 Turbo (0,11/0,45 Dollar). Die Preisstrategie zeigt Baidus Differenzierung zwischen High-Volume-Budget-Modellen und High-Capability-Modellen für komplexe multimodale Aufgaben.
Neben ERNIE 5.0 hat Baidu zwei Tage vor dem Event das Open-Source-Modell ERNIE-4.5-VL-28B-A3B-Thinking unter Apache 2.0 Lizenz veröffentlicht. Das Modell nutzt eine Mixture-of-Experts-Architektur, aktiviert nur 3 von 28 Milliarden Parametern und läuft auf einer einzelnen 80GB GPU. Technische Highlights sind „Thinking with Images“ für dynamische Zoom-basierte visuelle Analyse sowie Support für Chart-Interpretation, Dokumentenverständnis und temporales Bewusstsein in Videos. Die Kombination aus proprietärem Premium-Modell und Open-Source-Alternative gibt Baidu eine Zwei-Säulen-Strategie für unterschiedliche Marktsegmente.
Baidus AI-Ökosystem wächst über Foundation Models hinaus: Der General-Purpose-Agent GenFlow 3.0 hat über 20 Millionen User erreicht und ist damit der weltweit größte seiner Art. Apollo Go, Baidus autonomer Ride-Hailing-Service, hat über 17 Millionen Fahrten absolviert – aktuell 250.000 pro Woche, alle vollständig fahrerlos – und operiert in 22 Städten. Außerdem wird mit Miaoda (in westlichen Märkten medo.dev) ein No-Code-Agent positioniert, der Lovable und Co nicht unähnlich sieht

























