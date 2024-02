Was braucht ein AI-Startup heute, um mit dem Marktführer OpenAI zumindest (produkt-)technisch gleichziehen zu können? Genau, ein GPT-4-ähnliches Large Language Model, und ein Software-Interface eines Chatbots. Beides liefert nun das französische Startup Mistral AI weniger als ein Jahr nach der Gründung ab. Mit „Mistral Large“, wie das neueste LLM heißt, liefert man die Grundlage für den Großangriff auf OpenAI und Googles Gemini.

Mistral Large ist dabei mit einem Token-Fenster von 32.000 eher am unteren Ende der Skala angesiedelt und kann mit GPT-4, Gemini von Google oder dem Programmier-LLM des in Wien gegründeten Startups Magic bei weitem nicht mithalten. Dennoch sei es gut genug, um große Dokumente verarbeiten zu können, heißt es seitens des Pariser Unternehmens. Es würde „fließend Englisch, Französisch, Spanisch, Deutsch und Italienisch sprechen“, heißt es.

Mistral AI ist eines der am besten finanzierte AI-Startup der Welt und hat innerhalb nur eines Jahres fast 530 Mio. Dollar aufgenommen.

Mistral Large: „Das zweitbeste Modell der Welt“

„Mistral Large ist unser neues, hochmodernes Textgenerierungsmodell. Es erreicht erstklassige Argumentationsfähigkeiten. Es kann für komplexe mehrsprachige Argumentationsaufgaben verwendet werden, einschließlich Textverständnis, Transformation und Codegenerierung“, heißt es in einerAussendung. „Mistral Large erzielt starke Ergebnisse bei gängigen Benchmarks und ist damit das zweitbeste Modell der Welt, das allgemein über eine API verfügbar ist (nach GPT-4).“

Damit gesteht man eindeutig ein, dass Mistral Large GPT-4, das ChatGPT und Microsofts Copilot antreibt, unterlegen ist. Es sei jedoch besser als Claude 2 von Anthropic, Gemini Pro von Google oder auch das größte AI-Model von Meta, Llama 2. Hier die Benchmark-Vergleiche im MMLU-Test (Measuring Massive Multitask Language Understanding), die Mistral AI heute veröffentlicht hat:

Mistral AI ist bekannt dafür geworden, auf Open-Source-Modelle zu setzen, die prinzipiell jede:r laden und für eigene Zwecke einsetzen kann. Mittlerweile gibt es mit Llama 2 von meta Platforms und Gemma von Google (mehr dazu hier) ebenfalls offene AI-Modelle. Diese sind zwar nicht so Open Source wie jene von Mistral AI (man muss den Nutzungsbedingungen von Google und Meta zustimmen), kommen dem aber schon nahe.

Wer die AI-Modelle von Mistral AI ausprobieren wollte, musste bisher auf andere Plattformen wie Hugging Chat oder Poe ausweichen. Nun kann man die LLMs (neben Large gibt es noch „Next“ und „Small“) im neuen Chat-Interface ausprobieren. Das liegt aktuell in der Beta-Version vor und unterscheidet sich nicht wesentlich von den bekannten Interfaces von OpenAI, Microsoft oder Google. Links eine Spalte für die bisherigen Konversationen, in der Mitte schön groß das Chat-Interface. Bei „Le Chat“, wie die Franzosen es nennen, kann man aber keine Bilder generieren, Plug-ins verwenden oder eigene AI-Anwendungen anlegen.

Chat-Assistent könnte kontroverse Inhalte produzieren

„Wir arbeiten hart daran, unsere Modelle so nützlich und wenig rechthaberisch wie möglich zu machen, auch wenn noch viel zu verbessern ist! Dank eines einstellbaren Moderationsmechanismus auf Systemebene warnt dich le Chat auf nicht-invasive Weise, wenn du die Konversation in eine Richtung treibst, in der der Assistent sensible oder kontroverse Inhalte produzieren könnte“, heißt es aus dem Unternehmen. Das ist eine indirekte Warnung vor heiklen Inhalten, die „Le Chat“ produzieren könnte.

Ähnlich wie bei ChatGPT soll es auch eine Enterprise-Version des Chatbots geben, die einstellbare Moderationsmechanismen bietet – das gibt es aber nur auf Anfrage.

Damit sich die AI-Modelle von Mistral AI weiter verbreiten können, setzt das Pariser Startup nun auch auf Microsofts Azure-Cloud. Das neue Large-Modell kann nun auch via Azure AI Studio und Azure Machine Learning genutzt werden. Damit rückt das Startup ein wenig in die Nähe von OpenAI, das ja der große Partner von Microsoft ist. Aber auch Meta partnerte mit Microsoft, um das offene Llama-Modell via Azure anzubieten.