Gradium: AI-Startup sammelt 70 Millionen Dollar für Echtzeit-Audio-KI

Das frisch gegründete Pariser Startup Gradium, hervorgegangen aus dem französischen AI-Lab Kyutai, hat eine Seed-Runde über 70 Millionen Dollar abgeschlossen. FirstMark Capital und Eurazeo führen die Finanzierung an, DST Global Partners, Eric Schmidt, Xavier Niel, Rodolphe Saadé, Korelya Capital, Amplify Partners, Liquid2 und Drysdale Ventures investieren ebenfalls. Gradium entwickelt Audio-Sprachmodelle, die Echtzeit-Interaktionen zwischen Mensch und Maschine ermöglichen sollen – mit dem Anspruch, natürliche Stimmen als Standard-Interface zu etablieren.
Audio-native Architektur vereint mehrere Funktionen
Die AI-Plattform basiert auf einer Familie von Audio-Sprachmodellen, die Generierung, Transkription, Transformation und Dialog in einer einzigen neuronalen Architektur vereinen. Die Audio-Technologie von Gradium ist auf Englisch, Deutsch, Französisch, Spanisch und Portugiesisch verfügbar.
Gradium will in verschiedenen Bereichen durchstarten: Im Gesundheitswesen, Customer Support und Marktforschung, bei NPCs im Gaming sowie für Avatare in digitaler Werbung kommt die Technologie zum Einatz. Das Jungunternehmen positioniert sich als technisches Rückgrat für Voice-Technologie und will die bisherigen Trade-offs zwischen Natürlichkeit, Geschwindigkeit und Kosten eliminieren. Entwickler und Unternehmen können die Streaming-APIs über flexible Pläne nutzen.
Gründungsteam mit DeepMind- und Meta-Hintergrund
Das Gründungsteam bringt mehr als eine Dekade Erfahrung mit: CEO Neil Zeghidour kommt von Meta und Google DeepMind, CTO Olivier Teboul von Google Brain, Chief Coding Officer Laurent Mazaré von Google DeepMind und Jane Street, Chief Science Officer Alexandre Défossez ebenfalls von Meta. Gemeinsam entwickelten sie neuronale Audio-Codecs und Audio-Sprachmodelle als Open-Source-Software und nutzten diese Technologie, um die ersten Anwendungen für Voice-Cloning, Text-zu-Musik-Generierung und Sprachübersetzung zu realisieren. Das Team gründete zuvor Kyutai, ein Non-Profit-Lab für multimodale LLMs, das 2024 das erste Echtzeit-Konversationsmodell herausgebracht hat.
Gradium hält engen Kontakt zu Kyutais Forscher:innen und Engineers. Diese Nähe zur Grundlagenforschung soll einen schnellen, direkten Weg schaffen, um Durchbrüche in generativer Audio-Technologie in produktionsreife Produkte zu überführen. Nach nur drei Monaten seit Gründung bedienen Gradiums Streaming-Transkriptions- und Synthese-APIs bereits Kunden in der Produktion. Interessierte können die Demos und APIs auf der Gradium-Homepage testen.
ElevenLabs startet Marktplatz für KI-generierte Stimmen von Prominenten




























