Es vergeht derzeit kaum mehr ein Tag, an dem kein OpenAI-Herausforderer einen neuen GPT-4-Konkurrenten auf den Markt wirft. Heute ist es also Inflection AI rund um den Mitbegründer von DeepMind, Mustafa Suleyman. Schon zuvor hat man sich nach einer Milliardeninvestition durch Microsoft, Reid Hoffman, Bill Gates, Eric Schmidt und NVIDIA als „zweitbestes LLM der Welt“ hinter dem AI-Modell von OpenAI positioniert. Nun will man mit Inflection-2.5 endlich auf Augenhöhe mit dem Marktführer sein.

„Wir bringen Inflection-2.5 auf den Markt, unser verbessertes hauseigenes Modell, das mit allen weltweit führenden LLMs wie GPT-4 und Gemini konkurrenzfähig ist“, heißt es seitens des Startups. „Diesen Meilenstein haben wir mit unglaublicher Effizienz erreicht: Inflection-2.5 kommt an die Leistung von GPT-4 heran, benötigt aber nur 40 % der Rechenleistung für das Training.“ Allerdings sieht man in den veröffentlichten Benchmark-Werten, dass das neue AI-Modell noch nicht ganz an GPT-4 heranreicht.

Jedenfalls kann Inflection-2.5 bereits in Form von Pi, dem AI-Assistenten des Unternehmens, ausprobiert werden. Anders als OpenAi selbst oder seine Herausforderer Anthropic oder Mistral AI setzt das Unternehmen aus Palo Alto in Kalifornien ganz stark auf ein B2C-Modell. Während die anderen AI-Startups ihre LLMs auch via kostenpflichtiger API zur Verfügung stellen, geht es bei Inflection AI stark darum, Pi in Form von Apps für iPhone, Android und Desktop auf die Screen der User zu bringen. Für den Zugang der API kann man sich aktuell nur auf die Warteliste setzen lassen.

Deutliche Nähe zu Microsoft

Aktuell hält der Pi-Chatbot, der sogar schon mal zu Gast im Trending Topics-Podcast war, dem Anbieter zufolge bei einer Million täglich und sechs Millionen monatlicher Nutzer:innen. Da Microsoft zu den Investoren von Inflection AI zählt, kann man es dem Reich aus Redmond zuordnen – das merkt man auch daran, dass die Azure-Cloud im Hintergrund zum Einsatz kommt. Was angekündigt wurde, aber noch nicht funktioniert, ist die Anbindung ans Echtzeit-Internet – zumindest wird die Frage nach dem letzten Bitcoin-Allzeithoch mit „November 2021“ beantwortet, obwohl die richtige Antwort eigentlich der 5. März 2024 ist.

Wo sich Inflection AI aktuell nicht in die Karten blicken lassen will, sind Details zur Kontextfenster-Größe und der Anzahl der Parameter – also zwei wichtigen Werten, die Einblicke geben können, wie stark das LLM wirklich ist. Anders als andere multimodale AI-Modelle ist Pi auf Text und Code beschränkt, kann also keine Bilder wie ChatGPT oder Gemini erzeugen.

Dass Inflection AI einen Zwischenschritt bei der Veröffentlichung seiner LLMs macht, zeigt unter welchem Druck die Unternehmen derzeit stehen. In den vergangenen Wochen haben wie berichtet auch Mistral AI und Anthropic ihre neuesten Sprachmodelle auf den Markt gebracht und buhlen dort mit sehr ähnlichen Produkten (Chatbots, APIs) um die Gunst der Kunden gegen OpenAI, Microsoft und Google (Gemini).