In einer Welt, in der jede Minute neue Inhalte auf Online-Plattformen hochgeladen werden, ist die Content-Moderation oft eine immense Herausforderung. Schwierigkeiten nehmen mit KI und anderen technologischen Fortschritten stetig zu. Das britische Startup Unitary AI glaubt jedoch, einen innovativen Ansatz gefunden zu haben, um Moderationsprobleme zu bewältigen. Es setzt auf einen „multimodalen“ Ansatz, um die Inhaltsanalyse im komplexesten Medium von allen – und zwar im Bereich Video – zu unterstützen. Unitary AI hat kürzlich 15 Millionen US-Dollar an Finanzierung erhalten, um in diesem Bereich zu expandieren.

Unitary AI: Moderieren wie ein Mensch?

Jeden Tag wird eine unüberschaubare Menge an Inhalten veröffentlicht. Menschliche Moderator:innen sind oft schlichtweg überfordert. Die wirksamste Lösung besteht darin, menschliche Prüfer:innen mit automatisierten Ansätzen zu kombinieren, um dem Tempo und Umfang dieser Herausforderung gerecht zu werden. Unitary AI will sich genau dieser Herausforderung stellen und eine passende Lösung entwickeln. Das Unternehmen hat sich auf die Moderation von Videos spezialisiert und kombiniert visuelle, akustische und textliche Signale in einem einzigen Algorithmus. Unitary AI soll laut eigenen Angaben mehr als 25.000 Videobilder pro Sekunde bearbeiten können.

Das Besondere daran ist jedoch, dass die KI des Unternehmens Inhalte zudem wie ein Mensch interpretieren können soll. Ein Beispiel: Die Bedeutung von Nacktheit kann je nach Kontext stark variieren. Unitary AI soll derartige Nuancen verstehen und nicht nur visuelle Elemente bewerten, sondern auch den Text rund um einen Beitrag analysieren können. Dieser Ansatz verspricht eine effektivere und nuanciertere Moderation von Videoinhalten im Internet.

Ein Milliardenmarkt im Fokus der Startups

In den letzten Jahren haben zahlreiche Startups verschiedene Ansätze der künstlichen Intelligenz genutzt, um Tools zur Inhaltsmoderation zu entwickeln. Besonders im Bereich der Videomoderation stellt sich eine immense Herausforderung. Die schiere Datenmenge auf Plattformen wie YouTube, Facebook, Reddit oder TikTok, die zusammen mit Dating-Sites, Gaming-Plattformen und anderen Orten über 80 % des Online-Verkehrs ausmachen, übersteigt bei Weitem die Kapazität menschlicher Moderator:innen.

Investor:innen erkennen das Potenzial eines technologiegestützten Ansatzes zur Identifizierung schädlicher Inhalte in der Online-Welt. Trotz des großen Interesses ist der Markt für Content-Moderation stark umkämpft, mit Akteuren wie OpenAI, Microsoft, Hive, Active Fence, Oterlu und Sentropy, sowie Amazon’s Rekognition.

Finanzierung in Höhe von 15 Millionen US-Dollar gesichert

Passend dazu gibt Unitary AI heute bekannt, dass es eine Finanzierung in Höhe von 15 Millionen US-Dollar erhalten hat. Die Serie A-Finanzierungsrunde wird von renommierten europäischen Investoren wie Creandum angeführt, und auch Paladin Capital Group und Plural sind beteiligt.

Obwohl Unitary die Namen seiner Kunden nicht preisgibt, betont das Unternehmen, dass der jährliche Umsatz nun im Millionenbereich liegt. Die genaue Bewertung von Unitary bleibt dabei jedoch ein gut gehütetes Geheimnis. In der Liste der Investor:innen findet sich, laut einem TechCrunch-Bericht, aber auch Carolyn Everson, die ehemalige Führungskraft bei Meta.

Die Mittel aus dieser Finanzierungsrunde werden dazu verwendet, die Expansion in neue Regionen voranzutreiben und talentierte Fachkräfte einzustellen. Passend dazu erweitert das Unternehmen seine Plattform um weitere Sprachen.

Wie Unitary AI es besser machen will

Unitary AI würde Defizite in den vorhandenen Videomoderations-Tools sehen. Diese wären normalerweise auf die Analyse eines einzelnen Datenformats wie Text, Audio oder Bild spezialisiert, würden jedoch nicht gleichzeitig und in Kombination arbeiten. Das würde zu häufigen Fehleinschätzungen oder umgekehrt zu keiner Erkennung von problematischen Inhalten führen. Unitary AI möchte, diese Lücke durch die Einführung von multimodalen Ansätzen zu schließen.

„Das Innovative an Unitary ist, dass wir über echte multimodale Modelle verfügen“, sagte CEO Sasha Haco, der das Unternehmen zusammen mit CTO James Thewlis gründete, gegenüber TechCrunch.

Er fügte hinzu: „Anstatt nur eine Reihe von Bildern zu analysieren, muss man, um die Nuancen zu verstehen und zu verstehen, ob ein Video künstlerisch oder gewalttätig ist, die Art und Weise simulieren können, wie ein menschlicher Moderator das Video ansieht. Das erreichen wir durch die Analyse von Text, Ton und Bild.“