Entwicklung

KI frisst die Software-Margen: Wie SaaS jetzt mit Token-Kosten kalkulieren muss

co-written by newsrooms.ai13. Mai 2026, 11:05

Code in a screen. © Mohammad Rahmani auf Unsplash — Code on a screen. © Mohammad Rahmani auf Unsplash

Jahrzehntelang galt Software als das Geschäftsmodell mit den schönsten Margen der Welt: Produkt einmal bauen, beliebig oft verkaufen, wiederkehrende Umsätze einsammeln. Mit der Verbreitung von KI bricht diese Logik auf. Jede Anfrage an ein Sprachmodell verursacht reale Kosten – für Rechenleistung, Inferenz, Speicher und Netzwerk. Was Nutzer:innen als magisches Feature erleben, ist für Anbieter eine variable Kostenposition, die mit jeder Interaktion mitwächst.

Tony Wang, Portfolio-Manager bei T. Rowe Price, fasst die Verschiebung in einer aktuellen Analyse pointiert zusammen: „KI ist nicht nur ein neuer Produktzyklus, sie verändert die Margenstruktur der Technologiebranche.“ Der Grund sei simpel: „Intelligenz ist nicht mehr kostenlos. Jede KI-Interaktion erfordert Rechen-, Inferenz-, Speicher-, Speicherplatz- und Netzwerkressourcen.“

Wie hoch die Margen vor KI waren

Um die Tragweite dieser Verschiebung zu verstehen, lohnt ein Blick auf die ökonomische Basis, auf der die Branche jahrelang stand. Klassisches B2B-SaaS erzielte historisch Bruttomargen von 80 bis 90 Prozent – die Logik dahinter: Sobald die Software einmal gebaut war, kostete jeder zusätzliche Kunde fast nichts mehr, weil sich die Grenzkosten praktisch auf Hosting und Support beschränkten. Im skalierten Betrieb lagen die Cost of Goods Sold bei reifen SaaS-Anbietern typischerweise bei nur 10 bis 25 Prozent des Umsatzes. Sieben von zehn börsennotierten SaaS-Unternehmen wiesen Bruttomargen über 70 Prozent aus, die besten der Klasse erreichten 80 Prozent oder mehr (mehr dazu hier).

Mit KI bricht dieses Bild ein. Reine AI-First-Unternehmen kommen aktuell auf Bruttomargen von 50 bis 60 Prozent, Inferenz allein frisst rund 23 Prozent des Umsatzes. Über die Earnings-Saisons Q4 2025 und Q1 2026 hat sich bei börsennotierten SaaS-Anbietern, die offen über KI-bedingten Margendruck sprechen, ein neuer Operating-Korridor von 60 bis 70 Prozent Bruttomarge etabliert – und diese Kompression ist nicht temporär, sondern strukturell. Anders gesagt: Wer KI tief ins Produkt integriert, verliert im Schnitt 15 bis 30 Margenpunkte gegenüber dem alten SaaS-Standard (mehr dazu hier).

Vom Flatrate-Abo zum Token-Zähler

Die Konsequenz dieser neuen Kostenrealität zeigt sich inzwischen quer durch die SaaS-Welt. Notion etwa hat sein Preismodell schrittweise umgebaut: Klassische KI-Funktionen wie Schreibhilfe oder Meeting-Notes sind in den Business- und Enterprise-Plänen enthalten, doch für die neuen sogenannten Custom Agents – also proaktive KI, die selbstständig Aufgaben übernimmt – verlangt Notion separate Credits. 1.000 Credits kosten 10 US-Dollar, sind im Workspace geteilt und werden monatlich zurückgesetzt; sind sie aufgebraucht, pausieren alle Agenten bis zum nächsten Abrechnungszyklus oder bis ein Admin nachkauft. Der Verbrauch hängt davon ab, wie viele Informationen ein Agent verarbeitet, wie viele Tools er aufruft und welches Modell zum Einsatz kommt – leistungsfähigere Modelle ziehen mehr Credits.

Notion ist kein Einzelfall, sondern Symptom. GitHub Copilot soll in seiner Anfangszeit bei Power-Usern bis zu 80 US-Dollar pro Nutzer:in und Monat an Verlust verursacht haben, während pauschal nur 10 Dollar abgerechnet wurden. Microsoft zog die Konsequenz und führte Verbrauchslimits sowie zusätzliche Gebühren für die intensivere Nutzung ein. Auch Zendesk, Intercom oder Salesforce mit seinem Agentforce-Modell sind diesen Weg gegangen.

Wang sieht in dieser Entwicklung mehr als nur eine technische Anpassung. „Die Branche verschiebt sich von einer Welt hoher Margen-starker Softwareprodukte hin zu einer Welt, in der jede intelligente Aktion mit realen Kosten verbunden ist“, so der Portfoliomanager. Investor:innen würden die Frage daher neu stellen: „Sie fragen nicht mehr nur, welche Unternehmen KI erfolgreich einsetzen können, sondern welche Unternehmen aus diesen Investitionen attraktive Renditen erzielen können.“

Druck auf der Anwendungsebene

Für Anbieter auf der Anwendungsebene – also klassische SaaS-Player – wird die Lage zunehmend unbequem. Wer KI nicht integriert, riskiert, von KI-nativen Konkurrenten überholt zu werden. Wer integriert, frisst sich an den Margen fest. „Viele Unternehmen auf der Anwendungsebene sind gezwungen, aggressiv zu reinvestieren, um wettbewerbsfähig zu bleiben“, so Wang. Diese Investitionen könnten Produkte zwar langfristig stärken, „aber sie können auch die Margen unter Druck setzen und Unsicherheit hinsichtlich der Preisgestaltungsmacht und der Kapitalrendite schaffen.“

Wie sehr die Margenfrage SaaS-Anbieter umtreibt, zeigt das Hin und Her bei Salesforce: Innerhalb von rund 18 Monaten hat das Unternehmen drei verschiedene Preismodelle für Agentforce eingeführt – pro Konversation, pro Aktion via Flex Credits und zuletzt klassische Seat-Lizenzen ab 125 US-Dollar pro Nutzer:in und Monat. Drei Preismodelle laufen parallel für dasselbe Produkt – ein Hinweis darauf, dass der Markt noch keinen Konsens gefunden hat, wie KI eigentlich verkauft werden soll. Immer öfter sieht man, dass Software-Anbieter weg vom reinen Per-Seat-Pricing hin zu einem zusätzlichen Consumption-Based-Pricing gehen, in dem – vereinfacht gesagt – die Token-Kosten weiter verrechnet werden (mehr dazu hier).

Die Infrastruktur als neuer Engpass

Während die Anwendungsschicht ringt, sitzt eine andere Schicht des KI-Stacks strukturell auf der Sonnenseite. „Die Infrastrukturseite des KI-Ökosystems bleibt strukturell im Vorteil, da jeder KI-Workflow letztendlich mehr Rechen-, Speicher-, Speicherplatz- und Netzwerkkapazität erfordert“, so Wang. Besonders relevant werde dieser Vorteil mit dem Übergang von Chatbots zu Agenten: „Ein Chatbot beantwortet eine Frage. Ein Agent führt Arbeiten aus, durchdenkt Aufgaben, ruft Informationen ab, aktualisiert Pläne und agiert über Workflows hinweg. Das erfordert hinter den Kulissen deutlich mehr Infrastruktur.“

Damit verschieben sich nach Wangs Analyse auch die strategischen Engpässe der Branche. „In der traditionellen Software-Ära waren der Vertrieb und der Besitz des Kunden-Workflows die knappen Ressourcen. In der KI-Ära könnte die zunehmend wertvolle Position darin bestehen, die Infrastrukturschicht zu besitzen, von der jeder intelligente Workflow abhängt.“

Ausblick: ROI muss erst noch geliefert werden

Die kommenden Quartale werden zeigen, welche Anwendungsanbieter es schaffen, ihre KI-Features in Preise zu übersetzen, die Kund:innen akzeptieren und gleichzeitig Margen schützen. Gartner prognostiziert, dass bis 2030 mindestens 40 Prozent der Enterprise-SaaS-Ausgaben in usage-, agent- oder outcome-basierte Modelle wandern. Bis dahin gilt, was Wang nüchtern festhält: „KI schafft enorme Chancen, führt aber auch eine grundlegend andere Kostenstruktur ein. Die Unternehmen, die KI integrieren, müssen den Return on Investment noch nachweisen, während die Infrastrukturebene weiterhin von der steigenden Nachfrage im gesamten Ökosystem profitiert.“

Für Investor:innen heißt das: Die alte Faustregel, dass SaaS gleich Premium-Marge ist, gilt nicht mehr automatisch. Und für SaaS-Anbieter: Wer KI verschenkt, verschenkt im Zweifel auch seine Marge.

Rank My Startup: Erobere die Liga der Top Founder!

KI frisst die Software-Margen: Wie SaaS jetzt mit Token-Kosten kalkulieren muss

Wie hoch die Margen vor KI waren

Vom Flatrate-Abo zum Token-Zähler

Druck auf der Anwendungsebene

Die Infrastruktur als neuer Engpass

Ausblick: ROI muss erst noch geliefert werden

Specials unserer Partner

„Wir sind im internationalen Spitzenfeld“: ViennaUP präsentiert Wiens Spin-off-Power

pinyya will mit Aligned-Ownership den Wohnungskauf revolutionieren

Das verflixte dritte Jahr: Warum Liquiditätsplanung über Erfolg oder Scheitern entscheidet

„Calm, competent, connected“: Wie Wien mit der ViennaUP die internationale Tech-Szene gewinnt

Der Businessplan: Warum er zählt – und wie man ihn richtig aufbaut

i2b: Niederösterreich beweist seine Innovationskraft

Von der Idee zum Scaleup: Wie StartupNOW österreichische Startups auf Wachstumskurs bringt

#glaubandich CHALLENGE: Senseven ist Startup des Jahres 2026!

SVAN ist „Female Startup“ des Jahres der #glaubandich CHALLENGE 2026

Die besten Artikel in unserem Netzwerk

Claude greift auch Rechts-Branche an, könnte Legora oder Harvey in Bedrängnis bringen

NVision holt 55 Mio. Dollar für Quantencomputing im Gesundheitswesen

Future{hacks}: Der Unterschied zwischen Angreifer und Verteidiger: einer hat einen Plan

AIT-Bilanz 2025: 141 Millionen Euro Umsatz und 685 wissenschaftliche Publikationen

Heizma: Wärmepumpen-Startup erreicht 2 Millionen Euro Monatsumsatz

Anduril holt 5 Milliarden Dollar, Bewertung steigt auf 61 Milliarden Dollar

Anthropic soll mit Investoren Bewertung von 950 Milliarden Dollar verhandeln – Bericht

Space AI: Was SpaceX, Anthropic und Google da oben planen | Wasner + Steinschaden

2,1 Milliarden Dollar für Isomorphic Labs aus London für KI-getriebene Medikamentenentwicklung

Deep Dives

Wasner + Steinschaden | Der KI Podcast

Startup & Scale-up Investment Tracker 2026

RankMyStartup.com

#glaubandich CHALLENGE 2026

2 Minuten 2 Millionen | Staffel 13

IPO Spotlight

Future{hacks}

Trending Topics Tech Talk

Weiterlesen