Analyse

OpenAI braucht GPT-5, um Google, Anthropic und Perplexity wieder zu überholen

GPT-5 im Stil von "Civilisation". © ChatGPT
GPT-5 im Stil von "Civilisation". © ChatGPT
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Wer KI sagt, sagt meistens auch gleich ChatGPT. Im Konsumentenbereich ist es tatsächlich so, dass der AI-Chatbot von OpenAI die unangefochtene Nummer 1 am Markt ist. Technisch gesehen ist OpenAI aber tatsächlich bereits hinter die Konkurrenz zurückgefallen. Denn eigentlich ist es so, dass der Launch von GPT-4 im März 2023 bereits mehr als zwei Jahre her ist, und seither wurden mit Abwandlungen und Nebenmodellen wie GPT-4o, GPT-4.1, GPT-4.5, o3, o3-pro, o4-mini, o4-mini-high oder GPT-4.1-mini zwar deutliche Verbesserungen gezeigt.

Aber: Glaubt man den Testergebnissen der wichtigen LMArena, dann gibt es längst bessere KI-Modelle als GPT-4 und seine kleinen und großen Brüder und Schwestern. Insbesondere Google hat mit Gemini 2.5 Pro einen sehr starken Konkurrenten am Markt etabliert, der es in Bereichen wie Text-Generierung, Web Development, Bilderkennung und natürlich Internet-Suche zu mehr Punkten bringt als es die Modelle von OpenAI schaffen. Und auch Anthropic (v.a. im Bereich Coding), DeepSeek oder Elon Musks xAI haben aufgezeigt, dass sie mit OpenAI mithalten können.

Und so zeigt sich, dass OpenAI mit GPT-4o und Co in den Rankings (außer in der Kategorie „Image Editing“) nirgends mehr auf Platz 1 ist:

📄 Text-Generierung

Rang Modell Score Hersteller
1 gemini-2.5-pro 1460 Google
2 o3-2025-04-16 1452 OpenAI
3 chatgpt-4o-latest-20250326 1443 OpenAI
4 gpt-4.5-preview-2025-02-27 1438 OpenAI
5 grok-4-0709 1432 xAI
6 kimi-k2-0711-preview 1418 Moonshot AI
7 claude-opus-4-20250514-thinking-16k 1417 Anthropic
8 deepseek-r1-0528 1416 DeepSeek AI
9 claude-opus-4-20250514 1413 Anthropic
10 grok-3-preview-02-24 1410 xAI

🌐 WebDev

Rang Modell Score Hersteller
1 Gemini-2.5-Pro 1423 Google
2 DeepSeek-R1-0528 1407 DeepSeek AI
3 Claude Opus 4 (20250514) 1404 Anthropic
4 Claude Sonnet 4 (20250514) 1378 Anthropic
5 Claude 3.7 Sonnet (20250219) 1357 Anthropic
6 Gemini-2.5-Flash 1299 Google
7 GPT-4.1-2025-04-14 1255 OpenAI
8 Claude 3.5 Sonnet (20241022) 1238 Anthropic
9 DeepSeek-V3-0324 1207 DeepSeek AI
10 DeepSeek-R1 1198 DeepSeek AI

👁️ Vision

Rang Modell Score Hersteller
1 gemini-2.5-pro 1252 Google
2 chatgpt-4o-latest-20250326 1238 OpenAI
3 o3-2025-04-16 1219 OpenAI
4 gpt-4.5-preview-2025-02-27 1217 OpenAI
5 gemini-2.5-flash 1206 Google
6 gpt-4.1-2025-04-14 1201 OpenAI
7 o4-mini-2025-04-16 1193 OpenAI
8 gpt-4.1-mini-2025-04-14 1193 OpenAI
9 o1-2024-12-17 1187 OpenAI
10 claude-sonnet-4-20250514-thinking-32k 1182 Anthropic

🔍 Search

Rang Modell Score Hersteller
1 gemini-2.5-pro-grounding 1142 Google
2 ppl-sonar-reasoning-pro-high 1136 Perplexity
3 ppl-sonar-reasoning 1097 Perplexity
4 ppl-sonar 1072 Perplexity
5 ppl-sonar-pro-high 1071 Perplexity
6 ppl-sonar-pro 1066 Perplexity
7 gemini-2.0-flash-grounding 1028 Google
8 api-gpt-4o-search 1000 OpenAI
9 api-gpt-4o-search-high 999 OpenAI
10 api-gpt-4o-search-high-loc 994 OpenAI

🤖 Copilot

Rang Modell Score Hersteller
1 Deepseek V2.5 (FIM) 1028 DeepSeek AI
2 Claude 3.5 Sonnet (06/20) 1012 Anthropic
3 Claude 3.5 Sonnet (10/22) 1004 Anthropic
4 Codestral (25.01) 1001 Mistral AI
5 Qwen-2.5-Coder (FiM) 998 Alibaba Group
6 Mercury Coder Mini 994 Shining Lab
7 Codestral (05/24) 1001 Mistral AI
8 GPT-4o (08/06) 986 OpenAI
9 Gemini-1.5-Pro-002 986 Google
10 Meta-Llama-3.1-405B-Instruct 984 Meta AI

🎨 Text-to-Image

Rang Modell Score Hersteller
1 imagen-4.0-ultra-generate-preview-06-06-v2 1138 Google
2 gpt-image-1 1137 OpenAI
3 imagen-4.0-generate-preview-06-06-v2 1117 Google
4 imagen-4.0-ultra-generate-preview-06-06 1114 Google
5 imagen-4.0-generate-preview-05-20 1091 Google
6 flux-1-kontext-max 1074 Black Forest Labs
7 flux-1-kontext-pro 1070 Black Forest Labs
8 seedream-3 1065 ByteDance
9 imagen-3.0-generate-002 1063 Google
10 photon 1034 k.A.

✂️ Image Edit

Rang Modell Score Hersteller
1 gpt-image-1 1197 OpenAI
2 flux-1-kontext-max 1176 Black Forest Labs
3 flux-1-kontext-pro 1176 Black Forest Labs
4 flux-1-kontext-dev 1149 Black Forest Labs
5 seededit-3.0 1134 ByteDance
6 gemini-2.0-flash-preview-image-generation 1091 Google DeepMind
7 bagel 1046 k.A.
8 step1x-edit 1019 Stepfun AI Team

Kurz zu den Ranglisten selbst: Das LMarena-Ranking vergleicht KI-Modelle im direkten Duell, wobei Nutzer zwei Antworten bewerten und daraus ein Elo-basiertes Punktesystem entsteht. Kritik gibt es vor allem wegen mangelnder Transparenz und Wettbewerbsverzerrung: Große Anbieter können viele Varianten testen, aber nur die beste öffentlich listen – schwächere Versionen verschwinden. Das begünstigt „Score-Gaming“ und benachteiligt Open-Source-Modelle. Kritiker fordern mehr Offenheit und faire Regeln, etwa durch Begrenzung paralleler Tests und dauerhafte Sichtbarkeit aller Modelle.

Nichtsdestotrotz sind die LMArena-Ergebnisse doch sehr wesentlich für den Markt und spiegeln wieder, dass OpenAI einfahc nicht mehr die unangefochtene Nummer 1 ist, sondern mit Google, Anthropic, DeepSeek und xAI teilweise ebenbürtige oder sogar bessere Gegner hat.

GPT-5 soll Basis für neue Apps werden

Dementsprechend ist es diesen Sommer dringend erforderlich, dass mit GPT-5 der nächste große Wurf kommt. Im August soll das neue KI-Modell launchen, und nicht nur Sam Altman und seine Truppe, sondern die gesamte KI-Welt und darüber hinaus erwarten sich Großes. Wie berichtet, soll GPT-5 multimodal werden und Text, Bilder, Audio und Video beherrschen, sehr große Kontextfenster von bis zu 2 Millionen Token (für ganze Bücher) erlauben, bessere Personalisierung bieten, ein besseres Reasoning bieten und einiges mehr.

Parallel zum GPT-5-Launch wird mit Fidji Miso eine neue CEO für den Bereich Apps bei OpenAI beginnen. Sie hat bereits durchblicken lassen, dass sie ChatGPT stark in vertikalen Apps für Bereiche wie Bildung, Gesundheit, Berufsleben und Co denkt. Hier wird spannend zu sehen sein, sie das KI-Unternehmen GPT-5 einsetzt, um solche Anwendungen umzusetzen – und in welcher Form andere Firmen wie Startups auch an GPT-5 herankommen können.

Startup-Killer im Anmarsch? Das sind die OpenAI-Pläne unter der neuen CEO Fidji Simo

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen