Es ist mittlerweile fast 13 Jahre her, seit Apple seine Sprachsteuerung Siri im Rahmen der Produktpräsentation des iPhone 4S im Jahr 2011 der Weltöffentlichkeit vorgestellt hat. Siri war damals durchaus ein Highlight, weil es einer breiteren Masse erstmals kostenlos die Möglichkeit gab, mit einem Computer zu sprechen – auch wenn das anfangs noch ziemlich holprig war. Über die Jahre hat Apple Siri dann immer weiter aufgebohrt und auch in Macs, AirPods, Apple Watches und HomePods integriert.

Doch über die Jahre wurden die Updates für Siri immer dünner. Bei der Präsentation des aktuellen iPhone 15 etwa war Siri bloß eine Randnotiz, und bei den Launches wie der stark AI-getriebenen Journal-App spielte Siri auch keine große Rolle. Denn Siri, das unter anderem auf der Technologie Long Short-Term Memory (LSTM) von KI-Koryphäe Sepp Hochreiter von der JKU in Linz basiert, ist deutlich in die Jahre gekommen. Denn LSTM, das auch Alexa von Amazon unterstützt, wurde 2017 technisch von der Transformer-Technologie von Google, einer neuartigen neuronalen Netzwerkarchitektur für das Sprachverständnis, abgelöst – und das „T“ in ChatGPT steht bekanntermaßen für „Transformer“.

Und nun muss Apple, das in Sachen AI im Vergleich zu Microsoft (OpenAI, GPT-4 etc.) und Google (Gemini) mittlerweile ziemlich alt aussieht, 2024 liefern. CEO Tim Cook, der kürzlich das langjährige Apple-Car-Projekt zugunsten der AI-Entwicklungen abblies, hat bereits durchblicken lassen, dass man 2024 die hauseigenen AI-Bestrebungen zeigen würde. Zwar wird immer wieder betont, dass AI sowieso in zahlreichen Produkten am Werk sei (z.B. Podcast-Transkriptionen), Machine Learning und AI „absolut entscheidend“ für das Unternehmen seien und man ohnehin bereits seit Jahren an generativer AI forsche. Doch wirklich gezeigt hat Apple noch nichts.

Offenbar Google, Anthropic und Baidu im Rennen

Nun gibt es Gerüchte am Markt, dass Apple nicht nur mit Google über den möglichen Einsatz von Gemini am iPhone verhandelt, sondern offenbar auch bei ChatGPT-Macher OpenAI sowie dem chinesischen Suchkonzern Baidu und dem AI-Startup Anthropic („Claude“) angefragt hat. Das berichten aktuell das Wall Street Journal und Bloomberg übereinstimmend. Damit sieht es also so aus, als würde Apple (zumindest in einem ersten Schritt) nicht eine Eigenentwicklung an den Start bringen wollen, sondern das AI-Modell eines Drittanbieters.

Das ist auch durchaus verständlich. Zwar werden AI-Modelle immer besser, aber ein Restrisiko für Bias, Halluzinationen und Lügen bleibt bei der Technologie. Und nun stelle man sich mal vor, der AI-Assistent des iPhone fängt zu fantasieren an. Das könnte Apple nicht bloß negative Presse einbringen, sondern auch enorm viel Geld kosten.

Bestes Beispiel ist Tim Cook selbst. Dessen Satz „China würde ich nicht in dieser Kategorie sehen“ hat Apple kürzlich 490 Millionen Dollar gekostet. Cook hatte 2018 China aus der Reihe der Länder Russland, Indien, der Türkei und Brasilien, in denen es rückläufige Nachfrage gegeben hatte, ausgenommen – und das haben ihm später Aktionär:innen so übel genommen, dass der Konzern 2024 fast eine halbe Milliarde Dollar Strafe zahlte. Doch das schwache Chinageschäft kostete Apple kurz darauf Milliarden – die Aktionär:innen sahen sich geschädigt.

Auslagern statt Selbermachen?

Wenn nun Siri oder ähnliche Sprachassistenten am iPhone Halbwahrheiten von sich geben, wäre das eine immense Gefahr für den auf Perfektion getrimmten Apple-Konzern, der noch dazu auch viel Wert auf Datenschutz und digitale Privatsphäre legt. Da scheint es in einem ersten Schritt wohl besser, die Fehler anfällige GenAI-Sache an einen Partner wie Google oder Anthropic auszulagern – und für den chinesischen Markt etwa an Baidu (ein chinesisches AI-Modell für westliche Märkte wäre undenkbar).

Für Google spricht, dass es gegen das Doppelpack OpenAI & Microsoft aufholen muss. Mit Apple gibt es bereits einen langjährigen Partner in Sachen Search, und eine Integration am iPhone würde dem ChatGPT-Rivalen Gemini mit einem Schlag enorme Reichweite geben. Was gegen Google spricht, sind die Fehler die Gemini produziert (z.B. bei generierten Bildern) – und dass OpenAI wahrscheinlich im Sommer 2024 GPT-5 veröffentlichen wird, und dagegen werden andere AI-Modelle vermutlich auch alt aussehen.

Für Anthropic wiederum spricht, dass das Startup (eine Abspaltung von OpenAI mit Google und Amazon als Großinvestoren) viel Wert auf Qualität und Ethik gelegt wird. So werden die LLMs von Anthropic auch auf Basis von Grundsätzen und Leitlinien trainiert, unter anderem auch nach Apples Privacy Policy. Zudem ist das neueste AI-Modell des Startups, „Claude 3“, den AI-Modellen von OpenAI und Google in einigen Punkten sogar überlegen. Außerdem wurde Apple gerade vom US-Justizministerium als Smartphone-Monopolist verklagt – da wäre eine Partnerschaft mit Google wohl nur Öl ins Feuer.

Ein anderer Weg wäre, ein kleineres LLM direkt am iPhone zu integrieren und nicht in der Cloud von Microsoft, Google oder Amazon laufen zu lassen – das würde dem Privacy-Versprechen von Apple auch am ehesten entsprechen. Doch „Edge AI“, an der Apple forscht, ist möglicherweise noch nicht so weit, um 2024 präsentiert zu werden. Dass Apple LLM kann, ist zumindest schon bewiesen. Im Oktober 2023 veröffentlichten Forscher:innen des Konzerns ein Multimodal Large Language Model (MLLM) namens Ferret als Open Source.