Meta gewinnt Copyright-Klage wegen Bücher für KI-Training

Ein Bundesgericht in San Francisco hat am Mittwoch entschieden, dass Meta bei der Nutzung von Millionen Büchern zum Training seiner Llama-KI-Modelle nicht gegen das Urheberrecht verstoßen hat. Die Entscheidung markiert einen wichtigen Präzedenzfall in der rechtlichen Auseinandersetzung zwischen Kreativen und Tech-Unternehmen über die Nutzung urheberrechtlich geschützter Inhalte für KI-Entwicklung.
Die Grundlage der Klage
Etwa ein Dutzend Autoren, darunter Ta-Nehisi Coates und Richard Kadrey, hatten gegen Meta geklagt. Sie warfen dem Social-Media-Konzern vor, ohne ihre Zustimmung eine Bibliothek mit Millionen Online-Büchern, wissenschaftlichen Artikeln und Comics zum Training der Llama-KI-Modelle verwendet zu haben. Die genutzten Inhalte stammten unter anderem von LibGen, einer sogenannten „Schattenbibliothek“, die Inhalte zahlreicher Bücher ohne Erlaubnis der Rechteinhaber hostet.
Meta ist der Macher der Llama-Modelle, die unter eigener Lizenz anderen Unternehmen größtenteils kostenlos zur Verfügung gestellt werden. Aktuellen Benchmark-Tests zufolge können sie aber noch nicht mit jenen der Marktführer OpenAI, Google oder Anthropic mithalten.
Das Urteil: Fair Use als Schutz
Bundesrichter Vince Chhabria entschied, dass Metas Verwendung der Bücher unter die Fair-Use-Bestimmung des Urheberrechts fällt. Meta hatte argumentiert, dass die Werke zur Entwicklung einer transformativen Technologie verwendet wurden, was unabhängig von der Art des Erwerbs als Fair Use zu bewerten sei.
Der Richter betonte jedoch ausdrücklich, dass seine Entscheidung nicht bedeute, dass Metas Nutzung urheberrechtlich geschützter Materialien grundsätzlich rechtmäßig sei. Vielmehr hätten die Kläger die falschen Argumente vorgebracht und versäumt, ausreichende Belege für die richtigen Argumente zu liefern.
Rechtlicher Kontext und Parallelfälle
Die Entscheidung reiht sich in eine Serie ähnlicher Urteile ein. Bereits am Montag hatte ein Bundesgericht zugunsten des KI-Startups Anthropic entschieden, dessen Claude-Modelle mit legal erworbenen und manuell gescannten Büchern trainiert wurden. Allerdings steht in diesem Fall noch ein separates Verfahren bezüglich digital piratierter Bücher aus.
Marktauswirkungen als möglicher Streitpunkt
Richter Chhabria deutete an, dass ein „potenziell gewinnbringendes Argument“ die Marktdilution gewesen wäre – also der Schaden, der Rechteinhabern durch KI-Produkte entstehen könnte, die den Markt mit „endlosen Mengen an Bildern, Songs, Artikeln, Büchern und mehr“ überschwemmen könnten. Er warnte, dass KI den Anreiz für Menschen, „auf altmodische Weise kreativ zu sein“, dramatisch untergraben könnte.
Breitere Bedeutung für die KI-Industrie
Der Fall ist einer von Dutzenden rechtlichen Auseinandersetzungen, in denen Kreative größere finanzielle Rechte einfordern, wenn ihre Werke zum Training von KI-Modellen verwendet werden, die ihre Existenzgrundlage bedrohen könnten. Gleichzeitig profitieren Unternehmen von diesen Technologien. OpenAI und viele andere AI-Unternehmen sehen sich mit Klagen wegen mutmaßlicher Copyright-Verletzungen konfrontiert.
Die Entscheidung stellt einen wichtigen Sieg für Tech-Unternehmen dar, die KI entwickeln, auch wenn die rechtlichen Grundlagen für die Nutzung urheberrechtlich geschützter Inhalte zum KI-Training weiterhin umstritten bleiben. Die endgültige rechtliche Klärung dieser Fragen wird voraussichtlich weitere Gerichtsverfahren und möglicherweise höherinstanzliche Entscheidungen erfordern.