第一财经

突发!Anthropic新模型被美国政府封禁

该文章尚未提供 Русский 解读,以下为中文版内容。

核心内容总结

Anthropic(一家AI公司)刚提议建立全球AI政策机制,就被美国政府“盯上”——以国家安全为由,禁止所有外国国民(包括Anthropic的外籍员工)访问其新模型Fable 5和Mythos 5,导致这两款模型被迫停用。政府给出的理由是发现了“越狱”(绕过安全限制)Fable 5的方法,但Anthropic认为漏洞轻微且不通用,自己已做了大量安全测试,不认同这种封禁标准,觉得是误会,正在争取恢复访问权限。

一、刚呼吁全球AI监管,自家新模型先遭“封杀”

Anthropic前脚刚建议全球搞一套AI监管机制,后脚就被美国政府“重拳出击”。当地时间6月12日,美国政府以国家安全为理由,发布出口管制指令:不管外国国民是在美国境内还是境外,都不能访问Anthropic的Fable 5和Mythos 5这两款新模型,连Anthropic自己的外籍员工也不行。这直接导致Anthropic必须立刻停用这两款模型,确保所有客户都符合规定(其他模型不受影响)。有趣的是,Anthropic当天下午才收到指令,政府还没具体说明到底担心什么安全问题。

二、政府说有“越狱”风险,Anthropic:这漏洞根本不值一提

政府给出的封禁依据是“发现了绕过Fable 5的方法”,但Anthropic自己查了之后,觉得这事儿被夸大了:

  • 所谓的“越狱”演示,只是找出了几个之前就知道的小漏洞,而且这些漏洞很简单;
  • 其他公开的AI模型不用“越狱”也能发现这些漏洞;
  • 目前还没人找到“通用越狱方法”——也就是能广泛绕过安全限制、解除多种功能的办法;
  • 也没有收到任何关于这两款模型会造成危害的具体漏洞报告。

Anthropic觉得,就因为这点小漏洞就召回已经面向数亿用户的产品,太不合理了。

三、为了安全,Anthropic已经做了“超充分”的准备

Anthropic强调,自己对Fable 5的安全防护绝不是“走过场”:

  • 发布前几周,和美国政府、英国AI安全研究所(AISI)、多个第三方公司以及内部团队合作,花了几千小时做“红队测试”(就是专门找漏洞的测试);
  • 测试结果显示,Fable 5的安全措施比之前所有模型都有效;
  • 还建立了强保护措施,降低被滥用在网络安全等任务上的风险。

简单说,他们已经把能想到的安全问题都排查过了。

四、这件事的“连锁反应”:行业可能被“卡脖子”?Anthropic呼吁更合理的监管

Anthropic认为,如果政府这次的封禁标准推广到整个行业,那所有前沿AI模型都别想发布了——因为任何新模型都可能有小漏洞。所以他们呼吁:

  • 政府应该用透明、公正、基于技术事实的法定程序来监管,而不是突然下禁令;
  • 这次事件是个“误会”,他们正在全力和政府沟通,争取尽快恢复模型的访问权限。

言外之意:监管可以,但得讲道理,不能“一刀切”。

总结一下

这件事本质上是AI公司和政府在“安全标准”上的分歧:政府担心小漏洞可能被利用,Anthropic觉得小漏洞不影响整体安全,而且自己已经做了足够多的防护。对普通用户来说,暂时用不了这两款新模型;对行业来说,这可能是个信号——AI监管的尺度还在摸索中,未来新模型的发布可能会面临更严格的审查。但Anthropic的态度也很明确:监管要合理,不能“因小失大”。