Analyse

„Growth at all costs“ ist tot, lang lebe das KI-Abo

Big Tech on smartphone. © Mikhail Pushkarev auf Unsplash
Big Tech on smartphone. © Mikhail Pushkarev auf Unsplash

Der Siegeszug der Künstlichen Intelligenz (KI) steht vor einer ökonomischen Hürde: den astronomischen Betriebskosten. Während die Technologie für Endverbraucher immer präsenter wird, vollziehen Branchenriesen wie Meta und Google einen strategischen Wandel. Um die massiven Investitionen in Rechenleistung und Infrastruktur zu stemmen, rücken neue, abgestufte Abonnement-Modelle in den Fokus, die den Zugang zu leistungsfähiger KI zunehmend monetarisieren.

Lange Zeit war die Strategie der großen Technologiekonzerne geprägt von „Growth at all costs“ – Wachstum um jeden Preis, oft finanziert durch massive Werbeeinnahmen und weitgehend kostenlose Dienste. Doch die Ära der unbegrenzten, kostenlosen KI-Kapazitäten scheint sich dem Ende zuzuneigen. Die Rechenleistung, die für das Training und den Betrieb moderner Sprachmodelle benötigt wird, ist so teuer, dass die bisherigen Geschäftsmodelle allein nicht mehr ausreichen.

Dass Inferenz zum ultimativen Faktor für den KI-Roll-out wird, zeigen auch die Preiserhöhungen bei Anthropic oder OpenAI, die hinsichtlich ihren geplanten Börsengänge vermutlich bald noch deutlicher anfangen werden, auf die Monetarisierungs-Tube zu dürcken.

Meta: Von Social Media zu „Meta One“

Der Social-Media-Gigant Meta zeigt deutlich, wie dieser Übergang aussehen kann. Das Unternehmen rollt derzeit weltweit neue Abo-Pläne für seine Kernanwendungen aus. Mit Modellen wie „Instagram Plus“, „Facebook Plus“ und „WhatsApp Plus“ (Preise zwischen 2,99 und 3,99 US-Dollar pro Monat) versucht Meta, die Monetarisierung seiner bereits gesättigten Nutzerbasis zu diversifizieren. Während diese Pläne primär Zusatzfunktionen für Power-User bieten – etwa erweiterte Insights oder Profil-Customization –, deutet die strategische Ausrichtung auf ein tieferes Ziel hin.

Besonders relevant für die KI-Debatte ist das neue Testprojekt „Meta One“. Hierbei werden spezialisierte KI-Abos getestet, die über die rein sozialen Funktionen hinausgehen. Während eine Basisversion für Gelegenheitsnutzer kostenlos bleibt, bieten die Pläne „Meta One Plus“ (7,99 USD) und „Meta One Premium“ (19,99 USD) einen entscheidenden Vorteil: mehr Kapazität für rechenintensive Anfragen. Premium-Nutzer erhalten Zugang zu tieferem „Reasoning“ (logischem Denken) und erweiterten Möglichkeiten bei der Generierung von Videos und Bildern. Meta nutzt diese Differenzierung, um die Kosten für die komplexesten Rechenoperationen direkt auf die Nutzer umzulegen, die diese Funktionen am intensivsten beanspruchen.

Google: Massive Investitionen und gestaffelte Bundles

Google verfolgt eine noch deutlich aggressivere Investitionsstrategie. Laut CEO Sundar Pichai plant der Konzern, in diesem Jahr zwischen 180 und 190 Milliarden Dollar in KI-Infrastruktur zu investieren – ein sechsachtfacher Anstieg gegenüber dem Jahr 2022. Um diese Summen zu rechtfertigen, wird die Monetarisierung auf zwei Schienen vorangetrieben: Einerseits durch die Integration von Werbung in KI-Antworten, andererseits durch hochgradig gestaffelte Abo-Modelle.

Googles Strategie setzt auf die Bündelung von Diensten. Über verschiedene Stufen – von „AI Plus“ (ca. 8 Euro) bis hin zu „AI Ultra“ (bis zu 200 Euro) – erhalten Nutzer Zugriff auf immer leistungsfähigere Gemini-Modelle. Diese Abos sind oft mit bestehenden Diensten wie YouTube Premium verknüpft, um den Wert des Pakets für den Endverbraucher zu erhöhen. Die Skalierung ist gewaltig: Google verarbeitet mittlerweile über 3,2 Billiarden Token pro Monat – eine Menge, die sich innerhalb kürzester Zeit vervielfacht hat (mehr dazu hier).

Warum KI so teuer ist: Das Prinzip Token und Inferenz

Um zu verstehen, warum diese Abonnements notwendig werden, muss man die technische Grundlage der KI-Berechnung betrachten. Die Kosten entstehen primär durch zwei Faktoren: den Token-Verbrauch und den Prozess der Inferenz.

Tokens sind die Grundeinheiten, in denen KI-Modelle Informationen verarbeiten. Man kann sie sich als kleine Bausteine vorstellen – oft sind es Wortteile oder ganze Wörter. Wenn ein Nutzer eine Frage stellt, wird dieser Text in eine lange Sequenz von Tokens zerlegt. Je komplexer die Anfrage oder je länger der Antworttext, desto mehr Tokens müssen verarbeitet werden. Da jede einzelne Verarbeitung Rechenleistung benötigt, steigen die Kosten linear mit der Menge der Token.

Die Inferenz beschreibt den eigentlichen Rechenvorgang: den Moment, in dem das bereits trainierte Modell eine Eingabe erhält und daraus eine Antwort generiert. Im Gegensatz zum „Training“ (dem einmaligen Lernen der KI) findet die Inferenz bei jeder einzelnen Nutzeranfrage statt. Dieser Prozess findet auf spezialisierten, extrem teuren Grafikprozessoren (GPUs) statt, die enorme Mengen an Strom verbrauchen und eine massive Hardware-Infrastruktur erfordern.

Wenn ein Nutzer eine komplexe Aufgabe stellt – etwa die Analyse eines langen Dokuments oder die Erstellung eines Videos –, steigt nicht nur die Anzahl der Tokens, sondern auch die Komplexität der Inferenz. Das Modell muss „tiefer nachdenken“, was mehr Rechenzyklen und damit höhere Kosten verursacht. Die neuen Abo-Modelle von Meta und Google sind letztlich der Versuch, diese variablen Kosten durch eine feste Gebühr zu decken und die hochintensiven Nutzer von den Gelegenheitsnutzern zu trennen.

Rank My Startup: Erobere die Liga der Top Founder!
Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Deep Dives

Wasner + Steinschaden | Der KI Podcast

News, Modelle, Strategien

RankMyStartup.com

Steig' in die Liga der Top Founder auf!
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2026

Österreichs größter Startup-Wettbewerb - Top-Investoren mit an Bord

2 Minuten 2 Millionen | Staffel 13

Alle Startups | Alle Deals | Alle Hintergründe
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Future{hacks}

Zwischen Hype und Realität

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe

Weiterlesen