最近,一句“Mythos几小时就攻破了NSA几乎所有机密系统”在英文社交平台刷屏,让无数人震惊于AI的骇客能力。但真相很快迎来反转:写下这句话的《经济学人》记者Shashank Joshi亲自出面降温,指出这并非真实的网络入侵,而是一次授权的红队演练。Mythos在特定条件下配合其他工具,才在受控环境中以惊人速度发现漏洞,但攻击对象是NSA机密环境的副本,而非生产系统。
这场风波的源头来自参议院情报委员会副主席Mark Warner的发言,他转述了NSA局长Joshua Rudd的话,原意是呼吁对前沿模型实施强制性的发布前测试,而非指责Anthropic。Warner甚至强调,谢天谢地是Anthropic干的,换一家底线不硬的公司,光靠自愿测试根本兜不住。然而,这句话经过NSA、参议员、记者到社交媒体的层层传递,语气不断夸张,最终变成“AI攻破NSA”的突发新闻。
Mythos的真实能力仍值得警惕。据Axios报道,拿到Mythos权限的机构主要用它扫描自身环境,提前找出可能被利用的漏洞。NSA早在4月就确认,他们使用Mythos预览版进行红队演练,旁边有Anthropic工程师支持。红队演练和真入侵是两回事,但能在几小时内串通一套国家级机密环境副本的几乎所有漏洞,这个速度本身就是一个重要的安全预警信号。
鉴于Mythos的进攻性网络能力过于危险,Anthropic启动了玻璃翼计划,严格限制模型分发。首批约50家机构获得权限,包括AWS、苹果、谷歌、微软、英伟达、摩根大通等,6月2日又扩展到15个以上国家的约150家机构。模型不公开发售,只发给过审的防御方。这次事件提醒我们,AI的安全能力正在快速提升,但公众需要更谨慎地解读信息,避免被片面夸张的表述误导。对于AI从业者而言,关注红队演练的实际成果和防护策略,远比追逐耸人听闻的标题更有价值。