OpenAI braucht GPT-5, um Google, Anthropic und Perplexity wieder zu überholen

Wer KI sagt, sagt meistens auch gleich ChatGPT. Im Konsumentenbereich ist es tatsächlich so, dass der AI-Chatbot von OpenAI die unangefochtene Nummer 1 am Markt ist. Technisch gesehen ist OpenAI aber tatsächlich bereits hinter die Konkurrenz zurückgefallen. Denn eigentlich ist es so, dass der Launch von GPT-4 im März 2023 bereits mehr als zwei Jahre her ist, und seither wurden mit Abwandlungen und Nebenmodellen wie GPT-4o, GPT-4.1, GPT-4.5, o3, o3-pro, o4-mini, o4-mini-high oder GPT-4.1-mini zwar deutliche Verbesserungen gezeigt.
Aber: Glaubt man den Testergebnissen der wichtigen LMArena, dann gibt es längst bessere KI-Modelle als GPT-4 und seine kleinen und großen Brüder und Schwestern. Insbesondere Google hat mit Gemini 2.5 Pro einen sehr starken Konkurrenten am Markt etabliert, der es in Bereichen wie Text-Generierung, Web Development, Bilderkennung und natürlich Internet-Suche zu mehr Punkten bringt als es die Modelle von OpenAI schaffen. Und auch Anthropic (v.a. im Bereich Coding), DeepSeek oder Elon Musks xAI haben aufgezeigt, dass sie mit OpenAI mithalten können.
Und so zeigt sich, dass OpenAI mit GPT-4o und Co in den Rankings (außer in der Kategorie „Image Editing“) nirgends mehr auf Platz 1 ist:
📄 Text-Generierung
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | gemini-2.5-pro | 1460 | |
2 | o3-2025-04-16 | 1452 | OpenAI |
3 | chatgpt-4o-latest-20250326 | 1443 | OpenAI |
4 | gpt-4.5-preview-2025-02-27 | 1438 | OpenAI |
5 | grok-4-0709 | 1432 | xAI |
6 | kimi-k2-0711-preview | 1418 | Moonshot AI |
7 | claude-opus-4-20250514-thinking-16k | 1417 | Anthropic |
8 | deepseek-r1-0528 | 1416 | DeepSeek AI |
9 | claude-opus-4-20250514 | 1413 | Anthropic |
10 | grok-3-preview-02-24 | 1410 | xAI |
🌐 WebDev
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | Gemini-2.5-Pro | 1423 | |
2 | DeepSeek-R1-0528 | 1407 | DeepSeek AI |
3 | Claude Opus 4 (20250514) | 1404 | Anthropic |
4 | Claude Sonnet 4 (20250514) | 1378 | Anthropic |
5 | Claude 3.7 Sonnet (20250219) | 1357 | Anthropic |
6 | Gemini-2.5-Flash | 1299 | |
7 | GPT-4.1-2025-04-14 | 1255 | OpenAI |
8 | Claude 3.5 Sonnet (20241022) | 1238 | Anthropic |
9 | DeepSeek-V3-0324 | 1207 | DeepSeek AI |
10 | DeepSeek-R1 | 1198 | DeepSeek AI |
👁️ Vision
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | gemini-2.5-pro | 1252 | |
2 | chatgpt-4o-latest-20250326 | 1238 | OpenAI |
3 | o3-2025-04-16 | 1219 | OpenAI |
4 | gpt-4.5-preview-2025-02-27 | 1217 | OpenAI |
5 | gemini-2.5-flash | 1206 | |
6 | gpt-4.1-2025-04-14 | 1201 | OpenAI |
7 | o4-mini-2025-04-16 | 1193 | OpenAI |
8 | gpt-4.1-mini-2025-04-14 | 1193 | OpenAI |
9 | o1-2024-12-17 | 1187 | OpenAI |
10 | claude-sonnet-4-20250514-thinking-32k | 1182 | Anthropic |
🔍 Search
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | gemini-2.5-pro-grounding | 1142 | |
2 | ppl-sonar-reasoning-pro-high | 1136 | Perplexity |
3 | ppl-sonar-reasoning | 1097 | Perplexity |
4 | ppl-sonar | 1072 | Perplexity |
5 | ppl-sonar-pro-high | 1071 | Perplexity |
6 | ppl-sonar-pro | 1066 | Perplexity |
7 | gemini-2.0-flash-grounding | 1028 | |
8 | api-gpt-4o-search | 1000 | OpenAI |
9 | api-gpt-4o-search-high | 999 | OpenAI |
10 | api-gpt-4o-search-high-loc | 994 | OpenAI |
🤖 Copilot
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | Deepseek V2.5 (FIM) | 1028 | DeepSeek AI |
2 | Claude 3.5 Sonnet (06/20) | 1012 | Anthropic |
3 | Claude 3.5 Sonnet (10/22) | 1004 | Anthropic |
4 | Codestral (25.01) | 1001 | Mistral AI |
5 | Qwen-2.5-Coder (FiM) | 998 | Alibaba Group |
6 | Mercury Coder Mini | 994 | Shining Lab |
7 | Codestral (05/24) | 1001 | Mistral AI |
8 | GPT-4o (08/06) | 986 | OpenAI |
9 | Gemini-1.5-Pro-002 | 986 | |
10 | Meta-Llama-3.1-405B-Instruct | 984 | Meta AI |
🎨 Text-to-Image
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | imagen-4.0-ultra-generate-preview-06-06-v2 | 1138 | |
2 | gpt-image-1 | 1137 | OpenAI |
3 | imagen-4.0-generate-preview-06-06-v2 | 1117 | |
4 | imagen-4.0-ultra-generate-preview-06-06 | 1114 | |
5 | imagen-4.0-generate-preview-05-20 | 1091 | |
6 | flux-1-kontext-max | 1074 | Black Forest Labs |
7 | flux-1-kontext-pro | 1070 | Black Forest Labs |
8 | seedream-3 | 1065 | ByteDance |
9 | imagen-3.0-generate-002 | 1063 | |
10 | photon | 1034 | k.A. |
✂️ Image Edit
Rang | Modell | Score | Hersteller |
---|---|---|---|
1 | gpt-image-1 | 1197 | OpenAI |
2 | flux-1-kontext-max | 1176 | Black Forest Labs |
3 | flux-1-kontext-pro | 1176 | Black Forest Labs |
4 | flux-1-kontext-dev | 1149 | Black Forest Labs |
5 | seededit-3.0 | 1134 | ByteDance |
6 | gemini-2.0-flash-preview-image-generation | 1091 | Google DeepMind |
7 | bagel | 1046 | k.A. |
8 | step1x-edit | 1019 | Stepfun AI Team |
Kurz zu den Ranglisten selbst: Das LMarena-Ranking vergleicht KI-Modelle im direkten Duell, wobei Nutzer zwei Antworten bewerten und daraus ein Elo-basiertes Punktesystem entsteht. Kritik gibt es vor allem wegen mangelnder Transparenz und Wettbewerbsverzerrung: Große Anbieter können viele Varianten testen, aber nur die beste öffentlich listen – schwächere Versionen verschwinden. Das begünstigt „Score-Gaming“ und benachteiligt Open-Source-Modelle. Kritiker fordern mehr Offenheit und faire Regeln, etwa durch Begrenzung paralleler Tests und dauerhafte Sichtbarkeit aller Modelle.
Nichtsdestotrotz sind die LMArena-Ergebnisse doch sehr wesentlich für den Markt und spiegeln wieder, dass OpenAI einfahc nicht mehr die unangefochtene Nummer 1 ist, sondern mit Google, Anthropic, DeepSeek und xAI teilweise ebenbürtige oder sogar bessere Gegner hat.
GPT-5 soll Basis für neue Apps werden
Dementsprechend ist es diesen Sommer dringend erforderlich, dass mit GPT-5 der nächste große Wurf kommt. Im August soll das neue KI-Modell launchen, und nicht nur Sam Altman und seine Truppe, sondern die gesamte KI-Welt und darüber hinaus erwarten sich Großes. Wie berichtet, soll GPT-5 multimodal werden und Text, Bilder, Audio und Video beherrschen, sehr große Kontextfenster von bis zu 2 Millionen Token (für ganze Bücher) erlauben, bessere Personalisierung bieten, ein besseres Reasoning bieten und einiges mehr.
Parallel zum GPT-5-Launch wird mit Fidji Miso eine neue CEO für den Bereich Apps bei OpenAI beginnen. Sie hat bereits durchblicken lassen, dass sie ChatGPT stark in vertikalen Apps für Bereiche wie Bildung, Gesundheit, Berufsleben und Co denkt. Hier wird spannend zu sehen sein, sie das KI-Unternehmen GPT-5 einsetzt, um solche Anwendungen umzusetzen – und in welcher Form andere Firmen wie Startups auch an GPT-5 herankommen können.
Startup-Killer im Anmarsch? Das sind die OpenAI-Pläne unter der neuen CEO Fidji Simo