Analyse

OpenAI braucht GPT-5, um Google, Anthropic und Perplexity wieder zu überholen

Jakob Steinschaden28. Juli 2025, 16:33

GPT-5 im Stil von "Civilisation". © ChatGPT

Startup Interviewer: Gib uns dein erstes AI Interview

Wer KI sagt, sagt meistens auch gleich ChatGPT. Im Konsumentenbereich ist es tatsächlich so, dass der AI-Chatbot von OpenAI die unangefochtene Nummer 1 am Markt ist. Technisch gesehen ist OpenAI aber tatsächlich bereits hinter die Konkurrenz zurückgefallen. Denn eigentlich ist es so, dass der Launch von GPT-4 im März 2023 bereits mehr als zwei Jahre her ist, und seither wurden mit Abwandlungen und Nebenmodellen wie GPT-4o, GPT-4.1, GPT-4.5, o3, o3-pro, o4-mini, o4-mini-high oder GPT-4.1-mini zwar deutliche Verbesserungen gezeigt.

Aber: Glaubt man den Testergebnissen der wichtigen LMArena, dann gibt es längst bessere KI-Modelle als GPT-4 und seine kleinen und großen Brüder und Schwestern. Insbesondere Google hat mit Gemini 2.5 Pro einen sehr starken Konkurrenten am Markt etabliert, der es in Bereichen wie Text-Generierung, Web Development, Bilderkennung und natürlich Internet-Suche zu mehr Punkten bringt als es die Modelle von OpenAI schaffen. Und auch Anthropic (v.a. im Bereich Coding), DeepSeek oder Elon Musks xAI haben aufgezeigt, dass sie mit OpenAI mithalten können.

Und so zeigt sich, dass OpenAI mit GPT-4o und Co in den Rankings (außer in der Kategorie „Image Editing“) nirgends mehr auf Platz 1 ist:

📄 Text-Generierung

Rang	Modell	Score	Hersteller
1	gemini-2.5-pro	1460	Google
2	o3-2025-04-16	1452	OpenAI
3	chatgpt-4o-latest-20250326	1443	OpenAI
4	gpt-4.5-preview-2025-02-27	1438	OpenAI
5	grok-4-0709	1432	xAI
6	kimi-k2-0711-preview	1418	Moonshot AI
7	claude-opus-4-20250514-thinking-16k	1417	Anthropic
8	deepseek-r1-0528	1416	DeepSeek AI
9	claude-opus-4-20250514	1413	Anthropic
10	grok-3-preview-02-24	1410	xAI

🌐 WebDev

Rang	Modell	Score	Hersteller
1	Gemini-2.5-Pro	1423	Google
2	DeepSeek-R1-0528	1407	DeepSeek AI
3	Claude Opus 4 (20250514)	1404	Anthropic
4	Claude Sonnet 4 (20250514)	1378	Anthropic
5	Claude 3.7 Sonnet (20250219)	1357	Anthropic
6	Gemini-2.5-Flash	1299	Google
7	GPT-4.1-2025-04-14	1255	OpenAI
8	Claude 3.5 Sonnet (20241022)	1238	Anthropic
9	DeepSeek-V3-0324	1207	DeepSeek AI
10	DeepSeek-R1	1198	DeepSeek AI

👁️ Vision

Rang	Modell	Score	Hersteller
1	gemini-2.5-pro	1252	Google
2	chatgpt-4o-latest-20250326	1238	OpenAI
3	o3-2025-04-16	1219	OpenAI
4	gpt-4.5-preview-2025-02-27	1217	OpenAI
5	gemini-2.5-flash	1206	Google
6	gpt-4.1-2025-04-14	1201	OpenAI
7	o4-mini-2025-04-16	1193	OpenAI
8	gpt-4.1-mini-2025-04-14	1193	OpenAI
9	o1-2024-12-17	1187	OpenAI
10	claude-sonnet-4-20250514-thinking-32k	1182	Anthropic

🔍 Search

Rang	Modell	Score	Hersteller
1	gemini-2.5-pro-grounding	1142	Google
2	ppl-sonar-reasoning-pro-high	1136	Perplexity
3	ppl-sonar-reasoning	1097	Perplexity
4	ppl-sonar	1072	Perplexity
5	ppl-sonar-pro-high	1071	Perplexity
6	ppl-sonar-pro	1066	Perplexity
7	gemini-2.0-flash-grounding	1028	Google
8	api-gpt-4o-search	1000	OpenAI
9	api-gpt-4o-search-high	999	OpenAI
10	api-gpt-4o-search-high-loc	994	OpenAI

🤖 Copilot

Rang	Modell	Score	Hersteller
1	Deepseek V2.5 (FIM)	1028	DeepSeek AI
2	Claude 3.5 Sonnet (06/20)	1012	Anthropic
3	Claude 3.5 Sonnet (10/22)	1004	Anthropic
4	Codestral (25.01)	1001	Mistral AI
5	Qwen-2.5-Coder (FiM)	998	Alibaba Group
6	Mercury Coder Mini	994	Shining Lab
7	Codestral (05/24)	1001	Mistral AI
8	GPT-4o (08/06)	986	OpenAI
9	Gemini-1.5-Pro-002	986	Google
10	Meta-Llama-3.1-405B-Instruct	984	Meta AI

🎨 Text-to-Image

Rang	Modell	Score	Hersteller
1	imagen-4.0-ultra-generate-preview-06-06-v2	1138	Google
2	gpt-image-1	1137	OpenAI
3	imagen-4.0-generate-preview-06-06-v2	1117	Google
4	imagen-4.0-ultra-generate-preview-06-06	1114	Google
5	imagen-4.0-generate-preview-05-20	1091	Google
6	flux-1-kontext-max	1074	Black Forest Labs
7	flux-1-kontext-pro	1070	Black Forest Labs
8	seedream-3	1065	ByteDance
9	imagen-3.0-generate-002	1063	Google
10	photon	1034	k.A.

✂️ Image Edit

Rang	Modell	Score	Hersteller
1	gpt-image-1	1197	OpenAI
2	flux-1-kontext-max	1176	Black Forest Labs
3	flux-1-kontext-pro	1176	Black Forest Labs
4	flux-1-kontext-dev	1149	Black Forest Labs
5	seededit-3.0	1134	ByteDance
6	gemini-2.0-flash-preview-image-generation	1091	Google DeepMind
7	bagel	1046	k.A.
8	step1x-edit	1019	Stepfun AI Team

Kurz zu den Ranglisten selbst: Das LMarena-Ranking vergleicht KI-Modelle im direkten Duell, wobei Nutzer zwei Antworten bewerten und daraus ein Elo-basiertes Punktesystem entsteht. Kritik gibt es vor allem wegen mangelnder Transparenz und Wettbewerbsverzerrung: Große Anbieter können viele Varianten testen, aber nur die beste öffentlich listen – schwächere Versionen verschwinden. Das begünstigt „Score-Gaming“ und benachteiligt Open-Source-Modelle. Kritiker fordern mehr Offenheit und faire Regeln, etwa durch Begrenzung paralleler Tests und dauerhafte Sichtbarkeit aller Modelle.

Nichtsdestotrotz sind die LMArena-Ergebnisse doch sehr wesentlich für den Markt und spiegeln wieder, dass OpenAI einfahc nicht mehr die unangefochtene Nummer 1 ist, sondern mit Google, Anthropic, DeepSeek und xAI teilweise ebenbürtige oder sogar bessere Gegner hat.

GPT-5 soll Basis für neue Apps werden

Dementsprechend ist es diesen Sommer dringend erforderlich, dass mit GPT-5 der nächste große Wurf kommt. Im August soll das neue KI-Modell launchen, und nicht nur Sam Altman und seine Truppe, sondern die gesamte KI-Welt und darüber hinaus erwarten sich Großes. Wie berichtet, soll GPT-5 multimodal werden und Text, Bilder, Audio und Video beherrschen, sehr große Kontextfenster von bis zu 2 Millionen Token (für ganze Bücher) erlauben, bessere Personalisierung bieten, ein besseres Reasoning bieten und einiges mehr.

Parallel zum GPT-5-Launch wird mit Fidji Miso eine neue CEO für den Bereich Apps bei OpenAI beginnen. Sie hat bereits durchblicken lassen, dass sie ChatGPT stark in vertikalen Apps für Bereiche wie Bildung, Gesundheit, Berufsleben und Co denkt. Hier wird spannend zu sehen sein, sie das KI-Unternehmen GPT-5 einsetzt, um solche Anwendungen umzusetzen – und in welcher Form andere Firmen wie Startups auch an GPT-5 herankommen können.

Startup-Killer im Anmarsch? Das sind die OpenAI-Pläne unter der neuen CEO Fidji Simo

OpenAI braucht GPT-5, um Google, Anthropic und Perplexity wieder zu überholen

📄 Text-Generierung

🌐 WebDev

👁️ Vision

🔍 Search

🤖 Copilot

🎨 Text-to-Image

✂️ Image Edit

GPT-5 soll Basis für neue Apps werden

Specials unserer Partner

aws First Incubator 2026 Opens Applications for Early-Stage Startups

GO SEOUL 2026: Die Startrampe für AI- und Advanced Manufacturing-Startups nach Südkorea

#glaubandich CHALLENGE 2026: Bewerbungsphase läuft noch bis 9. November!

Drei Boost! – dieses Internet-Angebot bringt moderne Unternehmen wirklich voran

Kreativität im KI-Zeitalter: Der CultTech Summit zeigt, wie Kultur Technologie formt

Zwei Tage voller Impulse, Innovation und Inspiration: Die NOW Business Days 2025 stehen vor der Tür

Digitaler Wandel hautnah: Der New Technologies Summit am Flughafen Wien

Digitale Dekarbonisierung: Wie Energie Steiermark und ON ENERGY gemeinsam Gebäude klimafit machen

Fund F vergibt Award für das beste Female Startup der #glaubandich CHALLENGE 2026

Die besten Artikel in unserem Netzwerk

Ripple: Unternehmen hinter XRP holt 500 Millionen Dollar, Bewertung bei 40 Mrd. Dollar

Unchained Robotics: „Sprecht früh und regelmäßig mit euren Kunden“

Future{hacks}: Rückruf statt Release: wenn KI-Halluzinationen zur Haftung werden

AI-Aktien unter Druck: Investor Michael Burry wettet 1,1 Milliarden Dollar gegen Nvidia und Palantir

Apple bringt Live-Übersetzungen demnächst auch in der EU auf AirPods und Co.

AI Talk 50: Eigene LLMs bauen | Prisoner’s Dilemma | Skandal-Roboter Neo | Google Earth AI | Otera

Fit2go: Linzer Tiefkühlkost-Startup verdoppelt Umsatz und knackt Millionengrenze

Bitcoin stürzt auf 100.000 Dollar, neuerliches Blutbad bei Altcoins

Kommt der Bärenmarkt? Globale Liquidität bricht ein, Banken wackeln und Bitcoin verliert Boden

Deep Dives

#glaubandich CHALLENGE 2026

AI Talk

Future{hacks}

IPO Spotlight

Startup & Scale-up Investment Tracker 2025

Trending Topics Tech Talk

2 Minuten 2 Millionen | Staffel 12

BOLD Community

IPO Success Stories

Weiterlesen