核心内容の要約
AI企業Anthropic(Claudeの親会社)は、海賊版の書籍を使用してAIを訓練したことで作家たちから集団訴訟を起こされ、最終的に15億ドルの和解金を支払いました。しかし、この裁判の焦点は高額な弁護士費用に移りました(当初は3億ドルを要求していましたが、後に1億8750万ドルに減額)。また、裁判官は「海賊版の書籍を使用したAI訓練は著作権侵害にあたる」と判断しましたが、「正規の書籍を使用したAI訓練は『合理的な利用』に該当する」とも述べました(人間が本を読んで学ぶことに例えています)。Anthropicはコンプライアンスを遵守するために「パナマプロジェクト」を実施し、実際の書籍を購入して表紙を切り取りスキャンした後に破棄し、正規のテキストでAIを訓練しました。この紛争は、AI訓練における著作権の曖昧な領域と利益分配の矛盾を露呈しました。
1. なぜAI企業は海賊版の書籍を使用するのか?——正規版は面倒で、海賊版の方が手軽
AIが高品質のコンテンツを生成するためには良質なテキストが必要ですが、正規版の書籍を購入するには出版社と交渉し、契約を結び、著作権料を支払うという手続きが面倒です(AnthropicのCEOはこれを「法的・商業的な問題」と述べています)。そのため、彼らは以下のような「近道」を選びました:
- 公開されている海賊版データセット「Books3」(約20万冊の海賊版書籍が含まれている)を使用したところ、作家のAndrea Bartzは自分の著作が含まれていることを発見し、直接訴訟を起こしました。
- さらに驚くべきことに、Anthropicの共同創設者であるMann自身も積極的に関与し、2021年にはBooks3から19万冊以上の書籍をダウンロードし、その後海賊版サイトから500万冊をダウンロードしました。2022年に新しい海賊版サイトが登場すると、さらに200万冊をダウンロードし、「非常にタイムリーだ!」と同僚たちに呼びかけました。
つまり、時間とコストを節約するためであり、海賊版であることを知りながらも使用し続けたのです。
2. 裁判結果:15億ドルの賠償金と「法的な抜け穴」
2025年に裁判官は以下のように判決を下しました:
1. 海賊版を使用したAI訓練は著作権侵害にあたる:Anthropicが海賊版の書籍をダウンロード・保有した行為は「合理的な利用」の範囲には含まれず、すべてのダウンロードが著作権侵害とみなされ、15億ドルの賠償金を支払い、すべての海賊版コンテンツを破棄する必要があります。
2. 正規の書籍を使用したAI訓練は合法:裁判官は「合法的に購入された書籍」を使用してAIを訓練することを「革新的な創作行為」と評価しました(人間が本を読んで創作することに例えています)。つまり、人間が本を購入して読む際には、引用するたびに料金を支払う必要はありませんが、AIも同様です。
Anthropicはこの法的な抜け穴を利用し、「パナマプロジェクト」を実施しました。数千万ドルを投じて数百万冊の実際の書籍を購入し、表紙を切り取って電子テキストに変換した後、紙を破棄して回収しました。これにより、彼らは「正規の著作権がある」とされるテキストでAIを訓練することができるようになりました。作家たちはこの措置が本当に合理的かどうか疑問に思いましたが、裁判官はこれを認めました。
3. 最も問題なのは賠償金ではなく弁護士費用
15億ドルの賠償金は多額に聞こえますが、作家たちが実際に受け取る金額はわずかです。侵害された作品ごとに約3000ドルしかもらえず、そのうちの一部を著作権者(出版社など)に支払う必要があります。弁護士チームは当初3億ドル(和解金の20%)を要求しており、「これで十分に控えめだ」と主張しました。これにより、作家たち、裁判官、Anthropicの間で不満が生じました:
- 作家たち:自分たちが苦労して書いた作品が海賊版として使用され、得られる金額は弁護士の手取りのほんの一部に過ぎません。
- 裁判官とAnthropic:弁護士が詳細な作業時間の記録を提供していないため、なぜそんなに多くの費用を請求できるのか?
後に弁護士は割合を12.5%(1億8750万ドル)に減額しましたが、それでも7人の作家が反対しました。しかし、90%以上の作品が和解に同意したため、最終的な結果は変わらない可能性が高いです。この「創作の尊厳」をかけた裁判は、「弁護士費用はどれだけか」という論争に変わってしまいました。
4. AI訓練と人間の学習——この比喩には大きな議論がある
裁判官がAI訓練を人間の読書行為に例えたことが、この裁判の最も核心的な争点です:
- テクノロジー企業を支持する人々:これはAIの勝利だと考えており、今後は正規の書籍を使用してAIを訓練できるようになり、AIの発展が促進されると期待しています。
- 作家や倫理学者:AIは人間ではないと反論しています。人間が本を読むのは理解し吸収した後に創作するためであり、AIは大量のテキストを「コピー+再構成」するだけであり、本質的に異なります。もしAI訓練が「学習」と見なされるならば、作家の知的財産権は保護されないことになります。つまり、AIが自由に書籍を使用できるようになる可能性があります(正規版を購入するだけで済むのでしょうか?)
この議論は短期間で解決される見込みはありません。AI企業は発展を続け、作家たちは自分たちの権利を守りたいと考えていますが、法律はまだ技術の進歩に追いついていません。
まとめ
AI訓練における著作権問題は、「海賊版かどうか」という単純な問題ではありません。Anthropicの事例からわかるように:
1. 海賊版の使用は明らかに許されませんが、正規版を使用した訓練の境界線はまだ不明確です。
2. 利益分配は公平でなければなりません——弁護士が大部分を取り、作家たちが不当な扱いを受けるべきではありません。
3. AIと人間の創作の関係については、より明確な規則が必要です。
今後、AI企業、作家、法律界はこの問題について真剣に議論する必要があります。AIは本当に「本を読む」ことができるのか?そして、その結果として作家たちにどのように報酬を支払うべきなのか?さもなければ、同様の裁判は続くでしょう。