虎嗅

**La technologie RAG bouleverse l’écosystème du contenu : comment les détenteurs de droits d’auteur peuvent-ils défendre leurs intérêts face aux recherches menées par les IA ?**

原文:RAG技术冲击内容生态,版权人如何向AI搜索维权?

Résumé des points clés

La technologie RAG (Retrieval, Answering, and Generation) utilisée par les moteurs de recherche intelligents permet aux utilisateurs d’obtenir des réponses directement sans avoir à consulter le site web d’origine, bouleversant ainsi complètement le modèle économique des médias traditionnels qui reposent sur les clics des utilisateurs pour générer des revenus publicitaires et de abonnements. En conséquence, ces derniers ont engagé deux types de poursuites contre les entreprises spécialisées en IA : d’une part, ils utilisent la législation sur le droit d’auteur pour attaquer celles qui copient directement le contenu, comme Perplexity, considérées comme des entreprises “barbares” ne respectant pas les règles ; d’autre part, ils recourent à la législation antitrust contre des entreprises comme Google, jugées “civilisées” mais utilisant leur position dominante pour imposer des conditions inéquitables aux médias. L’article compare également les attitudes judiciaires des États-Unis et de la Chine : les États-Unis ont activement mené ces poursuites, tandis que la Chine adopte une approche plus prudente concernant les problèmes de violation du droit d’auteur liés à l’entraînement des modèles d’IA, afin de protéger son industrie naissante.

Analyse détaillée

#### 1. La technologie RAG : pourquoi une menace pour les médias ?

Les médias traditionnels tirent leurs revenus de deux sources principales : les clics des utilisateurs sur leurs sites pour consulter des publicités (payées par les annonceurs) et les abonnements payants au contenu. Avec la technologie RAG, lorsque les utilisateurs posent une question, l’IA parcourt en temps réel le contenu disponible sur Internet et fournit directement la réponse, évitant ainsi que les utilisateurs accèdent aux sites d’origine. Les médias perdent ainsi leurs revenus publicitaires et d’abonnements.

Contrairement aux grands modèles d’IA qui génèrent leur propre contenu après avoir appris une vaste quantité d’informations, RAG utilise directement du contenu existant sur Internet pour fournir des réponses. Même si les entreprises d’IA contrôlent le degré de copie, les utilisateurs n’ont pas besoin de se rendre sur les sites d’origine, ce qui représente une menace majeure pour les médias.

#### 2. CNN poursuit Perplexity : cette entreprise d’IA est trop “barbare”

Perplexity est un fournisseur de services basés sur l’IA dont la stratégie RAG ne respecte aucune règle :

  • Copie illégale du contenu : son algorithme parcourt les articles, images et vidéos de CNN, y compris ceux interdits par les protocoles robots, en se faisant passer pour un utilisateur ordinaire (par exemple, en utilisant un navigateur Chrome sur Mac) pour contourner les bloqueurs.
  • Réutilisation du contenu payant : lorsque les utilisateurs posent des questions, Perplexity copie de longs extraits d’articles de CNN dans ses réponses, y compris ceux accessibles uniquement après paiement. Par exemple, lorsqu’un utilisateur demande “Quelle fonction a abandonnée Rubio ?”, la version payante de Perplexity reproduit littéralement l’article original de CNN, ce qui constitue une violation du droit d’auteur.

#### 3. Google est également poursuivi : pourquoi un “civilisé” fait-il l’objet de poursuites antitrust ?

Google était autrefois une source importante de trafic pour les médias, car ses résultats de recherche contenaient des liens vers leurs sites, générant ainsi du trafic. Mais avec le développement des recherches intelligentes, les utilisateurs obtiennent désormais directement les réponses sans avoir à cliquer sur ces liens, ce qui a fortement diminué le trafic des médias.

Bien que Google respecte les protocoles robots et offre l’option de désactiver les résumés générés par l’IA, cette option est en réalité une “piège” : si les utilisateurs choisissent de ne pas voir de résumé, ils n’obtiennent plus aucun contenu de recherche, privant ainsi les médias de leur trafic essentiel (de nombreux médias reçoivent plus de 80 % de leur trafic de Google). Le groupe de médias Penske (propriétaire de marques comme Billboard) a donc poursuivi Google pour utilisation abusive de sa position dominante sur le marché des recherches.

#### 4. Derrière les poursuites : le dilemme du “balancement” entre progrès technologique et intérêts originaux

Les recherches intelligentes facilitent la vie des utilisateurs, mais elles menacent les médias qui perdent leurs revenus. Si cette tendance se poursuit, il n’y aura bientôt plus de contenu original à explorer pour les IA. Ces poursuites ne s’opposent pas à la technologie en elle-même, mais visent à régler la question du partage des bénéfices : les entreprises d’IA devraient-elles payer pour utiliser le contenu des médias ? Ou comment utiliser cette technologie de manière à répondre aux besoins des utilisateurs tout en protégeant les droits des créateurs originaux ? C’est un défi majeur que le progrès technologique doit surmonter.

#### 5. Attitudes judiciaires entre les États-Unis et la Chine

Les États-Unis ont déjà engagé de nombreuses poursuites relatives à l’IA, couvrant des domaines tels que le droit d’auteur et l’antitrust. En revanche, la Chine adopte une approche plus prudente, notamment en matière de violation du droit d’auteur lors de l’entraînement des modèles d’IA, afin de soutenir son industrie naissante en ce domaine. Cela représente un regret pour les chercheurs en droit de la propriété intellectuelle chinois, qui doivent se baser sur les cas américains pour comprendre les tendances juridiques.

En somme, cette “guerre” entre l’IA et les médias reflète le conflit entre les modèles économiques traditionnels et ceux nouveaux. La question fondamentale est de savoir comment faire en sorte que les bénéfices du progrès technologique profitent aux utilisateurs tout en préservant les intérêts des créateurs originaux.