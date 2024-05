„It Started to Sing“ ist der Titel des ersten von ElevenLabs generierten Songs, der an die Lieder aus High School Musical erinnert. Das KI-Audio-Startup ElevenLabs stellt erstmalig ein neues Tool vor, das die Eingabeaufforderung in einen Song mit Lyrics verwandelt. Bis dato hat das Forschungsteam rund um das Startup KI-Audiomodelle entwickelt, die realistische und kontextabhängige Sprach- und Soundeffekte erzeugen. Jetzt hat ElevenLabs die Musikindustrie ins Visier genommen.

Erster ElevenLabs Song released

ElevenLabs ist ein Unternehmen für KI-Audio-Forschung und -Einsatz und wurde 2022 von Piotr Dąbkowski, einem Ex-Google Machine Learning Engineer und Mateusz Staniszewski, einem Ex-Palantir Einsatzstrategen, programmiert. Ziel sei es, Inhalte in jeder Sprache und mit jeder Stimme universell zugänglich zu machen. Neuerdings werden aber auch Songs inklusive Lyrics komponiert: Schlaflieder für Kinder, Jingles für Marketingkampagnen oder Musikintros für Podcasts könnten künftig erstellt werden. Theoretisch möglich wäre auch, den nächsten Chart-Hit rauszubringen. Ammaar Reshi ist „Head of Design” bei ElevenLabs. Auf Twitter postete er: „Unser Musikmodell @elevenlabsio ist im Entstehen gemeinsam mit dem Preview-Song „It Started to Sing”, dessen Lyrics lauten:

„We were having fun programming young,

dreaming that one day we´ll make it work. Lines of code we´ll write all night,

hoping that one day we´ll get it right,

Can we teach the machine to sing?

Can we tach the machine to dream?

and then it started to sing…”

Schon Sam Altman hat bei der Einführung der generativen videogenerierenden KI „Sora” auf ein ähnliches Konzept gesetzt und die Community per Social Media aufgefordert, Ideen für Songtexte zu teilen.

Weitere Einsatzgebiete

Die ElevenLabs-Technologie soll für eine Vielzahl von Anwendungsgebieten herangezogen werden, zum Beispiel zur Vertonung von Hörbüchern und Nachrichtenartikeln, für die Animation von Videospielfiguren, zur Filmvorproduktion, aber auch um Audioinhalte für soziale Medien und Werbung zu generieren. Selbst für die Schulung von medizinischem Fachpersonal möchte man die KI-Audio einsetzen. Es gibt bereits ein Tool, das Filme in voller Länge synchronisieren kann. Das Startup, das im Jänner 2024 in einer Serie B-Finanzierungsrunde 80-Millionen-Dollar-Runde abstauben konnte, hat Großes vor: Es möchte Menschen, die ihre Stimme verloren haben, ihre Stimme zurückgegeben und auch all jenen mit Behinderungen ein nützliches Tool zur Seite stellen. Durch den Einsatz von maschinellem Lernen (ML) können Stimmen „geklont” beziehungsweise synthetisch reproduziert werden.

ElevenLabs-Marktplatz und Kritik an KI-Musik

Im Jänner startete der ElevenLabs-Marktplatz, der es User:innen durch die „Voice Library” ermöglicht, KI-Versionen ihrer eigenen Stimmen anzufertigen und damit Geld zu verdienen. Möglich, ja sogar wahrscheinlich ist, dass in Zukunft KI generierte Songs auf dem Marktplatz verkauft werden. Das Vorhaben wird jedoch nicht von allen begrüßt. Künstler:innen, Urheberrechtsexpert:innen und Ethiker:innen fragen sich, womit ElevenLabs sein Musikmodell @elevenlabsio trainiert hat und ob urheberrechtlich geschütztes Material dabei eine Rolle gespielt hat. Es ist unklar, ob für Trainingszwecke die Erlaubnis der Rechteinhaber:innen eingeholt wurde. Einige sprechen sich gegen die Entwicklung der KI-Musik aus, da die Gefahr besteht, Künstler:innen zu ersetzen. Außerdem steht die Befürchtung im Raum, dass die künstliche Intelligenz den Musikstil eines bestimmten Artists reproduzieren könnte.