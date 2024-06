Es sind Summen, die zum Staunen bringen: Mistral AI hat diese Woche in einer neuen Finanzierungsrunde von 600 Millionen Euro von neuen und alten Investoren eine Bewertung von 5,8 Milliarden Euro erhalten – eine Bewertung für eine ein Jahr alte Firma, die höher ist als die so mancher Bank oder Autokonzerns an der Börse.

Das besonders spannende dabei ist: Mistral AI hat es innerhalb eines Jahres geschafft, nicht bloß 7 unterschiedliche AI-Modelle (3 davon Open Source) auf den Markt zu bringen und Partnerschaften mit AWS, Google, Microsoft und IBM zu schließen, sondern das alles auch mit enorm hoher Effizienz zu tun. Denn bei Mistral AI mit Hauptsitz in Paris arbeiten aktuell lediglich 55 Mitarbeiter:innen.

Macht als 105 Millionen Euro Bewertung pro Mitarbeiter. Das ist somit sogar noch mehr als jene 105 Mio. Dollar pro Mitarbeiter:in (ca. 97 Mio. Euro), die aktuell der Chip-Riese Nvidia (Bewertung: 3,2 Billionen Dollar bei 29.600 Mitarbeiter:innen auf die Waage bringt. Mistral AI und Nvidia liegen damit Welten vor Apple, Meta, Microsoft oder Alphabet, die pro Mitarbeiter:in (auch sehr beachtliche 12 bis 18 Mio. Dollar) auf die Waage bringen.

Wienerin Gianna Maria Lengyel leitet das Business Development

Eine dieser 55 Mitarbeiter:innen ist die Wienerin Gianna Maria Lengyel, nach ihrer Zeit beim Fintech Billie in Berlin nun eben in Paris fürs Business Development bei Mistral AI tätig. Bei ihrem Wien-Aufenthalt gab sie am AI Summit am Mittwoch (organisiert von Women in AI und Dorda Digital Industries Group) Einblicke in das aktuell wertvollste europäische AI-Startup, das mit seinen LLMs immer wieder in einem Atemzug mit OpenAI, Anthropic, Google oder Meta genannt wird.

Von den genannten US-Unternehmen will sich Mistral AI mit einem teilweisen Open-Source-Ansatz und hoher Effizienz abheben. „Es gibt nicht ein LLM, das für alle Usecases gleich gut passt“, sagte bei ihrer Keynote. „Je größer die Zahl der Parameter, desto intelligenter. Aber größere Modelle brauchen auch länger, um die Aufgabe zu erledigen. Wenn man sehr schnelle Reaktionszeiten braucht, dann sollte man eher zu kleineren Modellen greifen.“

Deswegen biete Mistral AI im Untershcied zu anderen auch mittlerweile 7 unterschiedliche LLMs an – von kleinen Modellen mit 7 Milliarden Parametern unter Open-Source-Lizenz bis hin zu Mistral Large, dem aktuell stärksten Modell, proprietär via API. „Kommerzielle Modelle können auch sehr offen sein, wir bei Mistral AI erlauben etwa tiefe Einblicke in die Modelle. Bei OpenAI ist hingegen es eine Blackbox“, sagt Lengyel in Bezug auf den Hauptrivalen, an dem sich die gesamte Branche stets messen muss.

AI-Modelle: „Größer bedeutet nicht gleich besser“

Aber nur weil GPT-4o von OpenAI über Trillionen Parameter verfüge, heiße das nicht, dass es auch um Welten besser sei. „Größer bedeutet nicht gleich besser. Wir etwa haben effizientere Modelle geschaffen, die mit weniger Parametern eine höhere Performance schaffen als größere Modelle“, sagt sie. Aktuell würden Mistrals AI-Modelle sehr gefragt bei der Finanzindustrie auf der einen, bei der Tech-Branche auf der anderen Seite sein – auch Newsrooms.AI oder das Wiener HealthTech XUND setzen Mistral-Modelle ein. „Mehr Parameter verlangen mehr Infrastruktur, und verursachen dafür mehr Kosten.“

Wie auch andere LLM-Anbieter kämpft auch Mistral AI mit den berüchtigten Halluzinationen der AIs – also wenn sie Fakten verdrehen, Dinge erfinden oder einfach glatt lügen, um den User zu befriedigen. „Es ist schwer, Halluzinationen komplett einzuschränken. Ein Modell sagt nicht die Wahrheit, sondern die größte Wahrscheinlichkeit“, sagt sie. „Je mehr man nachfragt, desto mehr glaubt das Modell, dass es recht hat.“

Unterscheiden aber könne man sich von anderen Anbietern durch den – sehr europäischen – Datenschutz. „Unsere APIs tracken nicht die Inputs der User oder die Outputs fürs Training“, sagt Lengyel. Außerdem biete man so genannte „Guardrails“ an – diese technischen Hilfsmittel sollen ermöglichen, dem Modell vorzugeben, was es sagen darf. Etwa kann man einschränken, dass es sich über Mitbewerber äußert.

Open Source aus ideellen Gründen

Warum Mistral AI neben den kostenpflichtigen, proprietären AI-Modellen auch LLMs kostenlos und frei unter Open Source herausgibt? Das würde kommerziell zwar keinen Sinn machen, aber hätte vielmehr einen ideellen Hintergrund. Die drei Gründer von Mistral AI sind CEO Arthur Mensch, ehemaliger Research Scientist bei Google DeepMind, Guillaume Lample, ehemaliger Research Scientist bei Meta und Kopf von Llama, und CTO Timothée Lacroix, ehemaliger Software Engineer bei Meta. Sie sind es durch ihren wissenschaftlichen Hintergrund gewohnt, Forschungsergebnisse für alle zugänglich zu veröffentlichen – also machen sie es auch mit einigen LLMs.

Indirekt, so Lengyel, würde das aber die Awareness rund um die Marke Mistral AI stärken. „Das hat das Vertrauen in die Marke Mistral AI gestärkt, und es hilft uns, unsere großen proprietären Modelle zu verkaufen“, sagt sie. Wozu sie am Wiener AI Summit weniger sagen wollte, ist woher die Daten für das Training der AI-Modelle kommen würden. Zumindest sagt sie, dass es sich sowohl um frei verfügbare Daten als auch um zugekaufte Daten unter Lizenz handeln würde.