虎嗅

Nachdem er für das Stehlen von E-Books mit einer Geldstrafe in Höhe von 1,5 Milliarden US-Dollar belegt wurde, hat Claude nun auch Millionen gedruckter Bücher zerstört.

原文:偷下电子书、被罚15亿美元后,Claude又毁掉了百万本实体书

Zusammenfassung der Kerninhalte

Anthropic, der Mutterkonzern des AI-Unternehmens Claude, wurde von Autoren kollektiv verklagt, weil es bei der AI-Trainierung auf piratierte Bücher zurückgriff. Letztendlich kam es zu einer Einigung, bei der Anthropic 1,5 Milliarden US-Dollar entschädigte. Der Fokus des Rechtsstreits wandte sich jedoch später auf die hohen Anwaltskosten (anfangs forderten die Anwälte 300 Millionen, später reduzierte sich dieser Betrag auf 187,5 Millionen). Zudem stellte der Richter fest: Die Nutzung piraterischer Bücher zur AI-Trainierung stellt eine Urheberrechtsverletzung dar, während die Verwendung legal gekaufter Bücher als „angemessene Nutzung“ angesehen wird (analog zum menschlichen Lernprozess durch Lesen). Um den Anforderungen der Gesetzgebung zu entsprechen, startete Anthropic das „Panama-Projekt“: Sie kauften physische Bücher, scannten diese, vernichteten die Einbände und nutzten anschließend die legalen Texte zur AI-Trainierung. Dieser Streit hat die Grauzonen im Bereich der AI-Trainingsurheberrechte sowie die Spannungen bei der Verteilung der Interessen aufgedeckt.

Warum müssen AI-Unternehmen überhaupt piratierte Bücher für die Trainierung verwenden? – Legale Alternativen sind zu aufwendig und teuer

Um hochwertige Inhalte zu erzeugen, benötigen AI-Systeme qualitativ gute Texte – Bücher sind in dieser Hinsicht viel zuverlässiger als Online-Beiträge. Der Kauf legaler Lizenzen für Bücher ist jedoch sehr aufwendig: Man muss mit Verlagen verhandeln, Verträge unterzeichnen und Urheberrechtsgebühren zahlen (der CEO von Anthropic bezeichnete diesen Prozess als „rechtliche/geschäftliche Herausforderung“). Daher wählten die Unternehmen einen „Abkürzungsweg“:

  • Zunächst nutzten sie das öffentliche Piratendatensatzset „Books3“, das fast 200.000 piratierte Bücher enthielt; die Autorin Andrea Bartz entdeckte dabei, dass eines ihrer Bücher darin enthalten war, und verklagte Anthropic direkt.
  • Noch extremer: Ein Mitbegründer von Anthropic lud im Jahr 2021 mehr als 190.000 Bücher aus „Books3“ herunter, später weitere 5 Millionen von Piratenseiten; als neue Piratenseiten online kamen, lud er weitere 2 Millionen herunter und forderte seine Kollegen auf, ebenfalls davon zu profitieren – mit dem Kommentar: „Das ist wirklich rechtzeitig!“

Im Grunde genommen ging es dabei um die Einsparung von Zeit und Kosten – auch wenn sie wussten, dass es sich um Piratentexte handelte.

Ergebnis des Rechtsstreits: 1,5 Milliarden US-Dollar Entschädigung sowie ein „legales Schlupfloch“

Im Jahr 2025 entschied der Richter:

1. Die Nutzung piraterischer Bücher zur AI-Trainierung stellt eine Urheberrechtsverletzung dar; jede einzelne Herunterladung gilt als Rechtsverletzung, Anthropic muss daher 1,5 Milliarden US-Dollar zahlen und alle piratischen Inhalte vernichten.

2. Die Verwendung legal gekaufter Bücher zur AI-Trainierung wird als „angemessene Nutzung“ angesehen – der Richter verglich dies mit dem menschlichen Prozess des Lesens und Lernens: Wenn man ein Buch kauft, muss man nicht für jede Zitation bezahlen; das gilt auch für AI-Systeme.

Anthropic nutzte dieses Schlupfloch und startete das „Panama-Projekt“: Sie investierten Millionen in den Kauf von physischen Büchern, scannten diese in elektronische Formen und vernichteten anschließend die Papierseiten. Dadurch erhielten sie Texte mit „legalem Lizenzstatus“ und konnten ihre AI-Systeme rechtmäßig trainieren. Die Autoren waren verblüfft – aber der Richter stimmte dieser Vorgehensweise zu.

Das Ärgerlichste sind nicht die Entschädigungszahlungen, sondern die Anwaltskosten

Die 1,5 Milliarden US-Dollar an Entschädigung erscheinen viel, doch die Autoren erhielten nur einen geringen Anteil davon; pro betroffenem Werk bekamen sie etwa 3.000 US-Dollar, von denen ein Teil noch an die Rechteinhaber (z. B. Verlage) abgegeben werden musste. Die Anwaltskanzlei forderte anfangs 300 Millionen (20 % der Gesamtentschädigung) und bezeichnete dies als „sehr großzügig“. Dies führte zu Unzufriedenheit aller Beteiligten:

  • Autoren: Ihre hart geschriebenen Werke wurden ohne Genehmigung genutzt, und sie erhielten nur einen Bruchteil des Geldes.
  • Richter und Anthropic: Die Anwaltskanzlei legte keine detaillierten Arbeitszeiten vor – warum sollten sie dann so viel erhalten?

Später reduzierte die Kanzlei ihren Anteil auf 12,5 % (187,5 Millionen), doch sieben Autoren lehnten dies weiterhin ab. Mehr als 90 % der betroffenen Werke akzeptierten jedoch die Einigung; das endgültige Ergebnis wird voraussichtlich nicht mehr geändert werden – aus einem Rechtsstreit um die „Würde des kreativen Schaffens“ wurde letztendlich eine Debatte darüber, wie hoch die Anwaltskosten sein sollten.

Die Analogie zwischen AI-Trainierung und menschlichem Lernen ist umstritten

Die Verwendung von Büchern zur AI-Trainierung wird vom Richter als Vergleich zum menschlichen Lernprozess herangezogen – dies ist der Kernpunkt des Streits:

  • Befürworter von Technologieunternehmen: Sie sehen dies als einen Sieg für die AI-Branche, da künftig die Nutzung legal gekaufter Bücher möglich sein wird und somit der Entwicklung der AI vorangetrieben werden kann.
  • Autoren und Ethikexperten: Sie argumentieren, dass AI nicht menschlich ist; beim Menschen geht es um Verständnis, Aufnahme und anschließendes Schaffen, während AI lediglich Texte kopiert und neu kombiniert. Wenn die AI-Trainierung als „Lernen“ angesehen wird, sind die Urheberrechte der Autoren nicht mehr geschützt – könnten AI-Systeme dann einfach beliebige Bücher verwenden, solange sie diese legal kaufen?

Diese Debatte lässt sich in absehbarer Zeit nicht lösen: AI-Unternehmen wollen weiterentwickelt werden, Autoren möchten ihre Rechte schützen – doch das Gesetz hat noch nicht mit der Technologie Schritt gehalten.

Fazit

Das Urheberrechtsproblem bei der AI-Trainung ist komplexer als die Frage des „Pirateriets“. Der Fall von Anthropic zeigt:

1. Piraterie ist definitiv inakzeptabel, doch die Grenzen der legalen Nutzung sind unklar.

2. Die Verteilung der Interessen muss fair sein – Anwälte dürfen nicht zu viel erhalten, während Autoren benachteiligt werden.

3. Die Beziehung zwischen AI und menschlichem Schaffen benötigt klare Regeln.

In Zukunft müssen AI-Unternehmen, Autoren und die Juristengemeinde noch intensiver darüber diskutieren: Kann AI wirklich „Bücher lesen“ – und wenn ja, wie sollten die Kosten für diese Nutzung unter den Beteiligten verteilt werden? Andernfalls werden ähnliche Rechtsstreite weiterhin auftreten.