OpenAI wirft offene KI-Modelle gegen Meta und Chinas AI-Firmen ins Rennen

Endlich verdienen sie ihren Namen wieder ein bisschen mehr: ChatGPT-Macher OpenAI hat heute zwei neue Open-Weight-KI-Modelle veröffentlicht, nämlich gpt-oss-120B und gpt-oss-20B. Diese stellen nach Unternehmensangaben die ersten und leistungsfähigsten Open-Weight-Reasoning-Modelle von OpenAI dar. Es sind zwar nicht die ersten Modelle von OpenAI unter Open-Source-Lizenz (in diesem Fall die Apache-2.0-Lizenz, siehe unten), jedoch aber durchaus Modelle, die mit geschlossenen LLMs anderer Anbieter mithalten können.
Open Weights, nicht Open Source
„Open Weight“ bedeutet konkret, dass die “Gewichte” (Weights) (also die trainierten Parameter, die das „Wissen“ des Modells darstellen) öffentlich zugänglich sind. Diese Gewichte bestimmen, wie das Modell Eingaben verarbeitet und Ausgaben erzeugt. Nutzer können das Modell mit diesen offenen Gewichten herunterladen, nutzen,und für spezielle Anwendungsfälle anpassen. Im Gegensatz zu vollständig offenen Open-Source-Modellen wird bei Open Weight-Modellen der Quellcode, die Trainingsdaten und Trainingsmethoden nicht offengelegt. Man bekommt also das „Gehirn“ des Modells, aber nicht das “Schulbuch”, wie das Training durchgeführt wurde.
Ziel von OpenAI ist offenbar, im Bereich offener KI-Modelle mitzumischen, der derzeit zum einen von Meta mit seinen Llama-Modellen sowie Google mit Gemma und zum anderen von chinesischen KI-Anbietern wie DeepSeek und Alibaba dominiert wird. Ziel ist laut Aussendung des Unternehmens, dass vor allem Entwickler, Startups und Organisationen in Schwellenländern die beiden neuen Modelle nutzen, sowie diese in Hochsicherheitsumgebungen zum Einsatz kommen, wo KI auf eigenen Infrastruktur betrieben werden muss.
Leistung wie etwa o4-mini
Das größere Modell gpt-oss-120B erreicht laut OpenAI auf zentralen Benchmarks die Leistung des Reasoning-Modells o4-mini, benötigt dabei jedoch nur eine einzelne 80-GB-GPU. Das kleinere gpt-oss-20B wurde für den Einsatz auf 16-GB-Edge-Geräten (z.B. Smartphones) optimiert und soll starke Reasoning-Fähigkeiten auch in ressourcenbeschränkten Umgebungen ermöglichen.
Dass gpt-oss-120B auf einer Stufe mit o4-mini liegt, zeigt auch die Zweiteilung des OpenAI-Angebots, die man schon bei anderen Unternehmen wie Mistral gesehen hat: Schwächere KI-Modelle werden offen herausgegeben, während die stärkeren LLMs weiter geschlossen sind – also via API mit Token-Preisen bezogen werden müssen. GPT-4o, GPT-4.1 und bald auch GPT-5 sind also weiter kostenpflichtig.
OpenAI führt mit der Veröffentlichung auch ein neues Sicherheitsprotokoll namens „Worst-Case-Fine-Tuning“ ein. Dieses simuliert potenzielle böswillige Nutzung in den Bereichen Biologie und Cybersicherheit. Das Unternehmen veröffentlicht zusätzlich zu den üblichen Evaluierungen ein Sicherheitspapier und eine Systemkarte. Externe Experten haben die Methodik überprüft. Evaluierungscode, Prompts und Bewertungsrichtlinien werden ebenfalls bereitgestellt.
Verfügbar unter Apache-2.0-Lizenz
Die Modelle werden unter der Apache-2.0-Lizenz auf Hugging Face und anderen Plattformen zur Verfügung gestellt. OpenAI hat Entwicklerhandbücher und Tools für die Integration mit verschiedenen Plattformen wie vLLM, Ollama, llama.cpp und führenden GPU-Plattformen entwickelt. Diese sollen verantwortungsvolles Fine-Tuning und die Implementierung von Schutzmechanismen unterstützen.
Unter der Apache-2.0-Lizenz darf die Software frei genutzt, verändert, kopiert und weitergegeben werden, auch in kommerziellen oder proprietären Projekten. Der Verkauf der Software ist ebenfalls erlaubt, ohne dass der Quellcode offengelegt oder Änderungen wieder veröffentlicht werden müssen. Die Lizenz gilt insgesamt als eine sehr permissive Open-Source-Lizenz ohne Copyleft. Dabei sind bestimmte Pflichten einzuhalten: Der Lizenztext sowie Urheberrechtshinweise und gegebenenfalls eine NOTICE-Datei müssen mitgeliefert werden. Änderungen am Quellcode sind in den entsprechenden Dateien klar zu kennzeichnen. Markenrechte werden durch die Lizenz nicht automatisch übertragen, weshalb diese separaten Regelungen unterliegen.
Neben OpenAI haben unter anderem auch Mistral AI (Mistral Small), IBM, SNowflake oder die chinesischen Unternehmen bzw. Startups Alibaba (Qwen 3), MiniMax (M1) und Tsinghua KI-Modelle unter der Apache-2.0-Lizenz veröffentlicht. Das chinesische Startup DeepSeek, das dieses Jahr mit seinem AI-Modell die Branche schockte, fährt derweil unter MIT-Lizenz, die noch etwas freizügliger ist: Sie gilt als kürzer und einfacher und enthält keine expliziten Patentregelungen sowie keine Pflicht, Änderungen hervorzuheben.
Strategische Zielsetzung
Sam Altman, CEO von OpenAI, erklärte zur Veröffentlichung: „Wir freuen uns sehr, dieses Modell – das Ergebnis von Milliarden US-Dollar an Forschung – der Welt zur Verfügung zu stellen. So bringen wir KI in die Hände möglichst vieler Menschen.“ Das Unternehmen sieht in der Veröffentlichung eine Möglichkeit, neue Forschungsrichtungen zu ermöglichen. „Wir hoffen sehr, dass diese Veröffentlichung neue Formen von Forschung ermöglicht und ganz neue Produktkategorien hervorbringt“, so Altman weiter.
Die Open-Weight-Modelle sollen insbesondere Entwicklern, Start-ups und Organisationen in Schwellenländern oder Hochsicherheitsumgebungen zugutekommen, die KI auf ihrer eigenen Infrastruktur betreiben möchten. Altman betonte: „Seit unserer Gründung im Jahr 2015 ist es unser Ziel bei OpenAI, eine AGI zu entwickeln, die der gesamten Menschheit zugutekommt. In diesem Sinne freuen wir uns, dass die Welt künftig auf einem offenen KI-Stack aufbauen kann – entwickelt in den USA, geprägt von demokratischen Werten, kostenlos zugänglich und zum breiten Nutzen aller.“