Black Forest Labs bringt neue Bild-KI, um stärker mit OpenAI zu konkurrieren

Das deutsche KI-Startup Black Forest Labs hat eine neue Familie von Bildgenerierungsmodellen vorgestellt, die sowohl Text als auch Bilder als Eingabe verarbeiten können. Die FLUX.1 Kontext-Modelle ermöglichen es Nutzern, Bilder nicht nur zu erstellen, sondern auch iterativ zu bearbeiten und dabei Charaktere sowie Stile konsistent zu erhalten.
Im Gegensatz zu herkömmlichen Text-zu-Bild-Modellen verarbeitet FLUX.1 Kontext sowohl textuelle als auch visuelle Eingaben. Das System basiert auf „Generative Flow Matching“-Technologie und soll laut Unternehmensangaben bis zu achtmal schneller arbeiten als führende konkurrierende Modelle. Die Veröffentlichung der neuen Bild-KIs erfolgt kurze Zeit nachdem OpenAI mit seinen eigenen neuen Möglichkeiten zur Bildgenerierung einen Hit landete.
Die Modellfamilie umfasst drei Varianten: FLUX.1 Kontext [pro] für schnelle, iterative Bildbearbeitung, FLUX.1 Kontext [max] mit Fokus auf maximale Leistung und Geschwindigkeit, sowie FLUX.1 Kontext [dev] als Open-Weight-Variante für Forschungszwecke.
Kernfunktionen und technische Eigenschaften
Die neuen Modelle bieten mehrere spezialisierte Funktionen:
- Charakterkonsistenz: Erhaltung einzigartiger Bildelemente über verschiedene Szenen hinweg
- Lokale Bearbeitung: Gezielte Modifikation spezifischer Bildregionen ohne Beeinträchtigung anderer Bereiche
- Stil-Referenz: Generierung neuer Szenen unter Beibehaltung des Stils eines Referenzbildes
- Iterative Bearbeitung: Aufbau auf vorherigen Bearbeitungen durch mehrere Bearbeitungsrunden
Das Unternehmen hat zur Evaluation der Modelle den KontextBench-Benchmark entwickelt, der auf realen Anwendungsfällen basiert. In den Tests erreichte FLUX.1 Kontext [pro] die höchsten Bewertungen in den Kategorien Textbearbeitung und Charaktererhaltung.
Verfügbarkeit und Partnerschaften
FLUX.1 Kontext [pro] und [max] sind über verschiedene Plattformen verfügbar, darunter KreaAI, Freepik, Lightricks, OpenArt und LeonardoAI sowie über Infrastruktur-Partner wie FAL, Replicate und TogetherAI. Bei Grok von xAI war FLUX nur vorübergehend integriert und wurde wieder entfernt. Die Open-Weight-Variante FLUX.1 Kontext [dev] befindet sich derzeit in einer privaten Beta-Phase für Forschung und Sicherheitstests.
Zusätzlich hat Black Forest Labs den „FLUX Playground“ eingeführt – eine benutzerfreundliche Oberfläche zum Testen der Modelle ohne technische Integration. Neue Nutzer erhalten 200 Credits, die für etwa zwölf Bildgenerierungen mit FLUX.1 Kontext [pro] ausreichen.
Bekannte Limitierungen
Das Unternehmen dokumentiert transparent mehrere Schwachstellen des Systems: Extensive Multi-Turn-Bearbeitungssitzungen können visuelle Artefakte verursachen, die die Bildqualität beeinträchtigen. Gelegentlich befolgt das Modell Anweisungen nicht korrekt, und das Weltwissen bleibt begrenzt. Nach etwa sechs iterativen Bearbeitungen zeigen sich typischerweise deutliche Qualitätsverluste.
Die Veröffentlichung erfolgt in einem zunehmend umkämpften Markt für KI-Bildgenerierung. Google stellte kürzlich Imagen 4 vor, während OpenAI seine ChatGPT-Bildgenerierung erheblich verbessert hat. Black Forest Labs, gegründet von ehemaligen Stability AI-Mitarbeitern, soll sich Ende 2023 in Gesprächen für eine Finanzierungsrunde von 100 Millionen Dollar bei einer Bewertung von einer Milliarde Dollar befunden haben.