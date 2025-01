War zuletzt zu lesen, dass das französische AI-Startup Mistral AI Boden an die US-amerikanische und chinesische Konkurrenz verliert, setzen die Pariser nun zum Befreiungsschlag an. Und der heißt Open Source. Soeben hat Mistral sein neues KI-Modell „Mistral Small 3“ veröffentlicht, das unter der Open-Source-Lizenz Apache 2.0 daherkommt und nicht wie seine großen Brüder unter der „Mistral Research License“.

Kurz zu Mistral Small 3: Das AI-Modell soll es mit größeren Modellen wie Llama 3.3 70B oder Qwen 32B aufnehmen können und ist ein „ausgezeichneter offener Ersatz für undurchsichtige proprietäre Modelle wie GPT4o-mini“, heißt es in einer Aussendung. Dieser Seitenhieb auf OpenAI ist bewusst gesetzt. Diese Woche hat DeepSeek mit einem Open-Source-Modell die komplette KI-Welt auf den Kopf gestellt, und Mistral AI versucht nun in eine ähnliche Kerbe zu schlagen.

„Wir erneuern unsere Verpflichtung zur Verwendung der Apache 2.0 Lizenz für unsere Allzweckmodelle, da wir uns schrittweise von den MRL-lizenzierten Modellen entfernen. Wie bei Mistral Small 3 werden die Modellgewichte zum Herunterladen und lokalen Einsatz zur Verfügung stehen und können frei modifiziert und in jeder Hinsicht verwendet werden“, heißt es aus Paris.

Und weiter: „Diese Modelle werden auch über eine Server-lose API auf la Plateforme, über unsere On-Prem- und VPC-Implementierungen, unsere Anpassungs- und Orchestrierungsplattform sowie über unsere Inferenz- und Cloud-Partner verfügbar gemacht. Unternehmen und Entwickler, die spezielle Fähigkeiten benötigen (erhöhte Geschwindigkeit und Kontext, domänenspezifisches Wissen, aufgabenspezifische Modelle wie Code-Completion), können auf zusätzliche kommerzielle Modelle zählen, die unsere Beiträge zur Community ergänzen.“

„Mistral Small 3 ergänzt große Open-Source-Modelle“

Mistral hat sich ursprünglich stark auf Open-Source-KI fokussiert, ist dann aber bei seinen größeren, stärkeren Modellen auf geschlossene, proprietäre Systeme geschwenkt. Bewahrheitet dürfte sich das am Markt nicht haben, das mit bisher 1,1 Milliarden Dollar finanzierte KI-Startup konnte sich gegen die übermächtige und viel besser finanzierte Us-Konkurrenz kaum durchsetzen. Nun kehrt man zu Open Source zurück, und zwar unter der wichtigen Apache 2.0-Lizenz.

„Mistral Small 3 ergänzt große Open-Source-Modelle wie die jüngsten Versionen von DeepSeek und kann als starkes Basismodell für die Entwicklung von Argumentationsfähigkeiten dienen“, heißt es zum OS-Trend. „Neben vielen anderen Dingen werden wir in den kommenden Wochen kleine und große Mistral-Modelle mit verbesserten Argumentationsfähigkeiten entwickeln.“

Was kann nun „Mistral Small 3“? Das KI-Sprachmodell ist trotz seiner relativ kompakten Größe von 24 Milliarden Parametern mit deutlich größeren Modellen wie Llama 3.3 70B oder Qwen 32B vergleichbar. Es zeichnet sich seinen Entwicklern zufolge durch seine hohe Effizienz aus, indem es eine Genauigkeit von über 81% beim MMLU-Benchmark erreicht und dabei eine Latenz von nur 150 Token pro Sekunde aufweist. Dies soll es zu einem idealen Modell für Anwendungen, die sowohl robuste Sprachverarbeitung als auch schnelle Antwortzeiten erfordern, machen.

Die Vielseitigkeit von Mistral Small 3 zeigt sich in seinen zahlreichen Einsatzmöglichkeiten. Es eignet sich für schnelle Konversationsassistenz, Funktionsaufrufe mit geringer Latenz und kann durch Feinabstimmung zu einem Fachexperten in spezifischen Domänen werden. Besonders bemerkenswert ist seine Fähigkeit zur lokalen Inferenz, was es für Hobbyisten und Organisationen attraktiv macht, die sensible Daten verarbeiten müssen. Seine Leistungsfähigkeit in Bereichen wie Finanzbetrugsbekämpfung, Gesundheitswesen und Robotik unterstreicht das breite Anwendungsspektrum dieses KI-Modells.