Résumé des faits clés
Anthropic, la société mère de Claude (une entreprise spécialisée en intelligence artificielle), a été poursuivie collectivement par des écrivains pour avoir utilisé des livres piratés dans l'entraînement de ses algorithmes d'intelligence artificielle. L'affaire s'est finalement résolue par un accord de règlement à hauteur de 1,5 milliard de dollars. Cependant, le débat a ensuite porté sur les coûts exorbitants des avocats (initialement demandés à 300 millions de dollars, puis réduits à 187,5 millions). Le juge a également statué que l'utilisation de livres piratés dans l'entraînement d'IA constituait une violation du droit d'auteur, tandis que l'utilisation de livres légaux était considérée comme un « usage raisonnable » (à l'instar de la façon dont les humains lisent et apprennent). Pour se conformer aux règlements, Anthropic a mis en place le « Projet Panama » : acheter des livres physiques, les scanner après avoir retiré leur dos, puis les détruire pour utiliser le contenu légal dans l'entraînement de ses algorithmes. Cette affaire a révélé les zones d'ombre concernant les droits d'auteur dans le domaine de l'IA, ainsi que les contradictions liées à la distribution des bénéfices.
I. Pourquoi les entreprises d'IA doivent-elles « voler » des livres pour l'entraînement ? – Les livres légaux sont trop compliqués et les versions piratées sont plus pratiques
Pour générer du contenu de haute qualité, les algorithmes d'IA ont besoin de textes de bonne qualité, et les livres sont bien plus fiables que les posts en ligne. Cependant, acheter des droits d'utilisation de livres légaux est une procédure fastidieuse : il faut négocier avec les éditeurs, signer des contrats et payer des frais de copyright (le PDG d'Anthropic a décrit cela comme un « problème juridique et commercial ». C'est pourquoi elles ont choisi la voie la plus courte :
- Elles ont d'abord utilisé l'ensemble de données piratées public « Books3 », qui contient près de 200 000 livres piratés. L'écrivaine Andrea Bartz a découvert que ses livres y figuraient et a porté plainte ;
- Plus encore, le cofondateur d'Anthropic a personnellement participé à cette pratique : en 2021, il a téléchargé plus de 190 000 livres depuis « Books3 », puis 5 millions depuis des sites web pirates. Lorsque de nouveaux sites piratés sont apparus en 2022, il en a téléchargé 2 millions, invitant ses collègues à en profiter, déclarant que c'était « très opportun ».
En somme, l'objectif était de gagner du temps et d'économiser des coûts, même en sachant que les données étaient illégales.
II. Résultat de l'affaire : 1,5 milliard de dollars de dédommagement + une « faille juridique »
En 2025, le juge a rendu un jugement :
1. L'entraînement d'IA avec des données piratées constitue une violation du droit d'auteur : les actions d'Anthropic (téléchargements et possession de livres piratés) ne sont pas protégées par le principe de l'« usage raisonnable ». Chaque téléchargement est considéré comme une infraction, et Anthropic doit payer 1,5 milliard de dollars ainsi que détruire tous les contenus pirates ;
2. L'entraînement d'IA avec des livres légaux est autorisé : le juge a estimé que l'utilisation de livres achetés légalement pour l'entraînement d'IA représentait un « acte créatif révolutionnaire », comparable à la façon dont les humains créent après avoir lu et appris. Il a souligné qu'un auteur n'est pas tenu de payer chaque fois qu'il cite un livre qu'il a acheté ; il en va de même pour les algorithmes d'IA.
Anthropic a immédiatement exploité cette faille juridique en lançant le « Projet Panama » : elle a investi des millions de dollars pour acheter des milliers de livres physiques, les a scannés et a ensuite détruit les pages papier pour obtenir des textes légaux. Ainsi, elle pouvait utiliser ces textes pour entraîner ses algorithmes d'IA de manière légale. Les écrivains étaient perplexes, mais le juge a accepté cette approche.
III. Ce qui est le plus préoccupant, ce ne sont pas les dédommagements, mais les coûts des avocats
Le montant de 1,5 milliard de dollars de dédommagement semble élevé, mais la somme reçue par les écrivains est très faible (environ 3 000 dollars par œuvre, à partager avec les détenteurs des droits d'auteur, comme les éditeurs). Le cabinet d'avocats demandait initialement 300 millions de dollars (20 % du montant total), ce qui a provoqué le mécontentement de toutes les parties :
- Les écrivains : leurs œuvres ont été utilisées sans leur autorisation, et ils reçoivent une somme dérisoire en retour ;
- Le juge et Anthropic : les avocats n'ont pas fourni de preuves détaillées de leur travail ; pourquoi demander autant ?
Finalement, le pourcentage a été réduit à 12,5 % (187,5 millions de dollars), mais sept écrivains ont tout de même protesté. Néanmoins, plus de 90 % des œuvres ont accepté l'accord, et il est probable que le résultat final ne change pas : une affaire menée pour la « dignité de la création » s'est transformée en un débat sur le montant des honoraires des avocats.
IV. L'entraînement d'IA = l'apprentissage humain ? Une question très controversée
Le juge a comparé l'entraînement des algorithmes d'IA à la lecture humaine, ce qui est au cœur du débat :
- Les partisans des entreprises technologiques : considèrent que c'est une victoire pour l'IA, car cela permettra l'utilisation légale de livres légaux et favorisera le développement de cette technologie ;
- Les écrivains et les spécialistes en éthique : objectent en soulignant que les algorithmes d'IA ne sont pas des humains. La lecture humaine implique une compréhension et une assimilation avant la création, tandis que l'IA se contente de « copier et réorganiser » des textes. Si l'entraînement d'IA est considéré comme un processus d'apprentissage, les droits d'auteur des écrivains ne seraient plus garantis. En effet, les entreprises d'IA pourraient utiliser librement leurs œuvres à condition d'en acheter des versions légales.
Ce débat ne peut pas être résolu rapidement : les entreprises d'IA doivent se développer, tandis que les écrivains veulent protéger leurs droits. La loi n'a pas encore rattrapé la vitesse de l'avancement technologique.
Conclusion
La question des droits d'auteur dans le domaine de l'entraînement des algorithmes d'IA est plus complexe que la simple question du piratage. L'affaire d'Anthropic montre que :
1. Le piratage est inacceptable, mais les limites de l'usage légal des livres restent floues ;
2. La distribution des bénéfices doit être équitable : les avocats ne devraient pas obtenir la majeure partie des revenus, laissant les écrivains dans une situation précaire ;
3. La relation entre l'IA et la création humaine nécessite des règles plus claires.
À l'avenir, il sera essentiel que les entreprises d'IA, les écrivains et le monde juridique discutent sérieusement de la manière dont l'IA peut utiliser les œuvres littéraires et comment répartir les bénéfices. Sinon, des affaires similaires continueront à survenir.