虎嗅

RAG技术冲击内容生态,版权人如何向AI搜索维权?

核心内容总结

AI搜索的RAG技术让用户不用点击原网站就能直接获取答案,彻底打破了传统媒体靠“用户点击”赚广告和订阅费的商业模式。于是传统媒体对AI公司发起两类诉讼:用版权法起诉像Perplexity这样直接复制内容、无视规则的“野蛮人”;用反垄断法起诉像谷歌这样虽相对文明但利用垄断地位逼媒体接受不公平条件的“文明人”。文章还对比了中美司法态度:美国已积极推进相关诉讼,中国为保护AI产业对训练侵权问题持谨慎态度。

详细拆解解读

#### 1. RAG技术:为啥成了媒体的“饭碗掠夺者”?

传统媒体的钱袋子靠两样:一是用户点进网站看广告(广告商付费),二是用户付费订阅内容。但RAG模式的AI搜索,用户问问题时,AI会实时爬取网上的内容,把答案直接“喂”给用户——用户不用再点进原网站,媒体的广告和订阅收入就没了。

和传统大模型比,RAG更“狠”:传统大模型是学了海量知识后自己生成内容,一般不会抄某篇具体文章;但RAG是直接拿网上的内容整合答案,就算AI公司控制了复制比例,用户也不用去原网站,媒体照样没流量。所以媒体说这是“系统性劫持原创内容”,断了他们的活路。

#### 2. CNN告Perplexity:这个AI公司太“野”,抄内容还绕付费墙

Perplexity是个AI服务商,它的RAG玩法完全没底线:

  • 无视规则爬内容:用爬虫爬CNN的新闻、图片、视频,连网站明确禁止爬取的内容(robots协议)也不放过,还伪装成普通用户(比如假装是Mac上的Chrome浏览器)绕拦截。
  • 直接复制赚差价:用户问问题时,它把CNN的文章大段复制到答案里,甚至连CNN付费墙后面的内容都免费给用户看——用户给Perplexity交钱,CNN却一分钱没拿到。比如用户问“卢比奥放弃了哪个职务”,Perplexity的付费版直接抄了CNN原文,证据确凿。

所以CNN用版权法告它,说它侵犯了内容所有权。

#### 3. 谷歌也被告:“文明人”为啥挨反垄断官司?

谷歌以前是媒体的“流量恩人”:搜索结果给媒体链接,用户点进去,媒体有流量。但现在谷歌变了,搞AI搜索直接给答案,用户不用点链接,媒体流量大跌。

谷歌看似“文明”:尊重robots协议,还提供退出AI摘要的选项(用nosnippet标签)。但这个选项是“陷阱”——退出AI摘要的话,普通搜索也不给你展示摘要了,媒体彻底失去谷歌的流量(很多媒体80%以上流量来自谷歌),等于“死亡”。

Penske媒体集团(拥有Billboard等品牌)告谷歌反垄断:谷歌利用搜索市场的垄断地位,逼媒体“二选一”——要么接受AI摘要(失去流量),要么退出谷歌生态(更惨),这是不公平的捆绑交易。

#### 4. 诉讼背后:科技进步和原创利益的“平衡难题”

AI搜索确实方便了用户(不用点N个网页找答案),但原创媒体没收入了,谁还愿意做高质量内容?长期下去,AI也没东西可搜了。

这些诉讼不是反对AI技术,而是要解决“利益分配”问题:AI公司用了媒体的内容,是不是该付费?或者怎么合理使用,既能让用户方便,又能让原创者活下去?这是科技进步必须跨过的坎。

#### 5. 中美司法态度:美国先“动手”,中国还在“观望”

美国已经在推进AI相关诉讼:从训练数据侵权到RAG模式的版权/反垄断问题,案例越来越多;但中国为了保护新生的AI产业,对AI训练是否侵权的审判很谨慎,所以作者(中国知识产权律师)只能研究美国案例,这也是一种遗憾。

总的来说,这场AI和媒体的“战争”,本质是新旧商业模式的碰撞——如何让科技进步的红利,既惠及用户,又不牺牲原创者的利益,是接下来需要解决的核心问题。