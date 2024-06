Apple hat am Montag Abend weniger mit der Integration von ChatGPT in seine künftigen Betriebssysteme (ab Herbst, zuerst Englisch und USA) überrascht, sondern eigentlich damit, dass es eigene Apple Intelligence-Modelle parat hat, die sowohl direkt am Gerät (On-Device) als auch in einer eigens dafür geschaffenen Cloud ausgeführt werden können. Da fragt man sich: Warum dann OpenAIs GPT-4o und künftig vielleicht auch Googles Gemini und andere LLMs integrieren, wenn man doch eigene AI-Modelle hat?

Die Antwort darauf findet man in den Zahlen und Benchmark-Tests, die Apple nun herausgegeben hat. Sie zeigen, dass Apple bei einigen Vergleichen (Schreiben sowie Anweisungsgetreue Auswertung, kurz IFEval) einige der bekanntesten AI-Modelle der Konkurrenz schlagen kann – und zwar nicht nur aus der Cloud heraus, sondern auch bei der Ausführung direkt am Gerät (in dem Fall ein iPhone 15 Pro).

Apples LLMs sind schon ziemlich gut

Verglichen wurde Apples AI-Modell mit:

GPT-3.5 von OpenAI

GPT-4 von OpenAI

Phi 3 Mini von Microsoft

Mistral 7B von Mistral AI

Mixtral 8x22B von Mistral AI

Gemma 2B von Google

Gemma 7B von Google

Und das kam heraus:

GPT-4o und Gemini 1.5 Pro sind sicher besser

Der Vergleich zu den beiden laut Chatbot Arena besten LLMs, nämlich GPT-4 Turbo sowie GPT-4o von OpenAI sowie Gemini 1.5 Pro von Google, fehlt demnach. Damit ist auch klar, warum Apple GPT-4o von OpenAI am Herbst bei iPhone, iPad und Mac ermöglicht, und auch plant, Googles Gemini zu integrieren: Weil es mit den Top-LLMs noch nicht mithalten kann. Aber es gibt noch andere gute Gründe, Plattform für die anderen zu spielen.

Apple schafft damit folgende Vorteile für sich: