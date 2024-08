Nachdem es ja bei Stability AI, vor gar nicht allzu langer Zeit wegen „Stable Diffusion“ in der AI-Branche schwer gehypt, zu Problemen kam, hat sich ein Forscherteam unter dem neuen Namen Black Forest Labs abgespaltet. Das große Ziel: Mit Text-to-Image- und Text-to-Video-Modellen wollen sie es mit den ganz großen der Branche aufnehmen. Für den Start, der kürzlich erfolgte, erhielt das brandneue AI-Startup 31 Mio. Dollar Andressen Horowitz, General Catalyst, MätchVC und den Business Angels Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila und Vladlen Koltun.

Es ist aber nicht die Finanzierungsrunde, was derzeit viele im AI-Sektor begeistert, sondern die Qualität der Bilder, die der Bildgenerator Flux.1 ausspuckt. Menschliche Gesichter und vor allem auch Hände, mit denen AI-Modelle stets zu kämpfen haben, werden sehr authentisch erzeugt. Laut Benchmark-Tests soll es Flux.1 mit anderen am Markt verfügbaren führenden Bildgeneratoren aufnehmen und diese übertreffen können – also unter anderem Midjourney v6.0, Dalle-E 3 von OpenAI und SD3-Ultra von Stable Diffusion. Auch bei der Einhaltung der Prompts etwa in Bezug auf Schriften soll das Modell sehr genau sein.

Text-to-Video-Modell soll folgen

Warum kann ein blutjunges AI-Startup aus dem Nichts heraus plötzlich die führenden Bildgeneratoren herausfordern? Nun, die Macher dahinter (u.a. Andreas Blattmann, Axel Sauer, Dominik Lorenz) sind keine Unbekannten. Sie gehörten zu jenen AI-Forscher:innen, die an der Entwicklung von Stable Diffusion XL oder Stable Video Diffusion beteiligt waren, bringen also enorme Vorerfahrung mit der Thematik mit. Da es bei Stability AI zu ordentlichen Verwerfungen (u.a. trat der CEO und Gründer Emad Mostaque aus dem Unternehmen aus) und Kündigungen kam, dürfte das zum Start von Black Forest Labs beigetragen haben.

Bei Bildgenerierung soll es aber nicht bleiben. Das Team kündigte an, einen sehr kompetitiven Video-Generator auf den Markt bringen zu wollen. Dieser fährt derzeit unter dem Modellnamen SOTA – was natürlich deutlich an das Text-to-Video-Modell Sora von OpenAI erinnert. Sora wurde der Öffentlichkeit schon vorgestellt, ist aber nur ausgewählten Tester:innen zugänglich.

Anders als der Name und die Beteiligten vermuten lassen, ist Black Forest Labs aber kein deutsches Startup, sondern hat sich dem Impressum zufolge in Wilmington nahe Philadelphia angesiedelt.