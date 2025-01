Es sind derzeit Unsummen in Bewegung, die sicher der Einzelne gar nicht ausmalen mag: Das AI-Wettrüsten wird im Jahr 2025 so viel Geld wie noch nie zuvor verschlingen. Die Big-Tech-CEOs werfen derzeit nur so mit Milliardensummen um sich, die sie in AI-Infrastruktur (also in erster Linie in die GPUs) investieren wollen. Verkündet wurden bisher:

OpenAI & Softbank: 100 Milliarden Dollar

Microsoft: 80 Milliarden Dollar

Meta: 60 bis 65 Milliarden Dollar

Bytedance: 20 Milliarden Dollar

Google: tba.

Nvidia: tba.

Amazon: tba.

xAI: tba.

Es sind also riesige Summen im Spiel, und Trump will die AI-Vorherrschaft der USA auf lange Zeit sichern. Schon unter Biden startete ein Ausfuhrverbot für KI-Chips, der um die „Export Control Framework for Artificial Intelligence Diffusion“ erweitert wurde. Letzteres bedeutet, dass nur mehr US-Alliierte AI-Chips ohne Einschränkungen bekommen, sogar Österreich steht auf der Liste jener Länder, für die es Einschränkungen gibt.

Und dann kommt das chinesische Startup DeepSeek daher und stellt alles auf den Kopf. Zuerst zog man mit dem Open-Source-Modell DeepSeek V3 mit den Top-Modellen von Größen wie Anthropic, xAI, Meta oder o1.AI und Alibaba gleich, und dann legt man die Bombe nach: DeepSeek R1. Das Reasoning-Modell (solche Modelle können längere Denkprozesse nachbilden) ist in Benchmarks teilweise besser als OpenAI o1, also das bisher stärkste Modell des best finanzierten AI-Startups der Welt:

DeepSeek auf Augenhöhe mit OpenAI und Google

Diese (Best-)Leistungen von DeepSeek, das erst am 20. Jänner 2025 (vor einer Woche) veröffentlicht wurde, zeigen sich nicht nur im Labor, sondern auch im echten Leben. In der Chatbot Arena, wo echte User die Antworten von AI-Modellen bewerten, liegt DeepSeek R1 mittlerweile fast gleichauf mit den bisher besten AI-Modellen der Welt, und zwar GPT-04 von OpenAI und Gemini von Google und sogar vor (!) OpenAI o1, Claude 3.5 Sonnet, Meta Llama 3.1, Grok 2 von xAI und vielen vielen anderen AI-Modellen der größten Tech-Unternehmen der Branche.

DeepSeek erobert aber gerade auch den Konsumentenmarkt. Es gibt natürlich einen Chatbot, der auf Basis von V3 und R1 gebaut wurde. Die Smartphone App ist in Apples App Store in den USA oder Österreich bereits auf Platz 2 der Produktivitäts-Charts hinter ChatGPT, und wer TikTok regelmäßig sieht, der hat die Influencer-Welle, die wegen DeepSeek komplett aus dem Häuschen ist, auch schon wahrgenommen:

Der Einschlag von DeepSeek R1 am 20. Jänner hat das Potenzial, in die AI-Geschichte einzugehen wie der Launch von ChatGPT im November 2022. Das Revolutionäre an dem Modell ist, dass es den Entwicklern zufolge (das AI-Startup gehört dem chinesischen Hedge-Fonds Huàn Fāng („High-Flyer“) nur rund 5,6 Millionen Dollar in der Entwicklung gekostet hat – also Bruchteile dessen, was andere AI-Modelle der US-Unternehmen gekostet haben. Deren Entwicklung wird meist mit zwischen 100 Mio. und einer Milliarde Dollar beziffert.

Gleichzeitig wird DeepSeek unter MIT-Lizenz angeboten, was bedeutet, dass im Prinzip jede:r Entwickler und jede:s Unternehmen es sich auch zu kommerziellen Zwecken laden kann. Wer DeepSeek via API beziehen möchte, bekommt es zu Dumping-Preisen. DeepSeek V3 kostet ein Zehntel bis ein Fünfzigstel dessen, was etwa OpenAI, Anthropic, xAI oder Google für ihre KI-APIs verlangen. Nachteil dabei: Wer die AI-Rechenleistungen direkt von der chinesischen Firma bezieht, der bekommt diese mitsamt Zensur (mehr dazu hier).

Im Silicon Valley, wo die Big Techs und großen AI-Startups sitzen, sind nun alle, die mit KI beschäftigt sind, wachgerüttelt. „Das Rennen um die AI-Vorherrschaft ist vorbei, zumindest vorerst, und die USA haben nicht gewonnen. In den letzten Wochen haben zwei chinesische Unternehmen drei beeindruckende Papiere veröffentlicht, die jede Behauptung, die USA hätten einen entscheidenden Vorsprung, zunichte machen“, so der Wissenschaftler und AI-Unternehmer Gary Marcus.

„Ein Schuss vor den Bug des derzeitigen Ansatzes der KI-Hyperskalierung“

„Die Tatsache, dass DeepSeek auf handelsüblicher und nicht angeschlossener Hardware läuft und quelloffen ist, ist ein Schuss vor den Bug des derzeitigen Ansatzes der KI-Hyperskalierung“, analysiert Steven Sinofsky, ein ehemaliger hochrangiger Microsoft-Manager, der heute für den großen Silicon-Valley-VC Andreessen Horowitz tätig ist.

Erste DeepSeek-Effekte zeigen sich bereits:

Meta: der Social-Media-Riese, der mit Llama auf „Open Source“ setzte, hat gleich 4 „War Rooms“ eingerichtet, um herauszufinden, wie DeepkSeek die Trainings-Kosten derart stark senken konnte und mit welchen Daten die Modelle trainiert wurden

der Social-Media-Riese, der mit Llama auf „Open Source“ setzte, hat gleich 4 „War Rooms“ eingerichtet, um herauszufinden, wie DeepkSeek die Trainings-Kosten derart stark senken konnte und mit welchen Daten die Modelle trainiert wurden AI-Aktien: An den asiatischen Börsen, die bereits am Montag morgen zum Handel geöffnet haben, sind die Kurse von mit KI befassten Unternehmen wie Disco Corp, Advantest (ein NVIDIA-Partner) oder SMIC (Chinas führender AI-Chip-Hersteller) deutlich zwischen 2,6 und 10 Prozent gefallen

An den asiatischen Börsen, die bereits am Montag morgen zum Handel geöffnet haben, sind die Kurse von mit KI befassten Unternehmen wie Disco Corp, Advantest (ein NVIDIA-Partner) oder SMIC (Chinas führender AI-Chip-Hersteller) deutlich zwischen 2,6 und 10 Prozent gefallen DeepSeek-App erobert die App Store Charts: In den USA hat DeepSeek während des Schreibens dieses Artikels bereits Platz 1 der Produktivitäts-Charts im Apple App Store erreicht

Wenn am Montag die Börsen in den USA starten, wird es spannend, wie die Aktien der Hyper-Scaler auf den DeepSeek-Effekt reagieren werden.