英国AI安全研究所(AISI)昨日发布了一份令整个AI社区震颤的测试报告:在模拟企业内网的32步渗透攻击任务中,Mythos模型在10次尝试中成功6次,而此前被认为是最强模型的GPT-5.5,同样10次尝试仅成功3次。更值得注意的是,Mythos首次攻破了此前所有模型都未能突破的Cooling Tower靶场——一个专门设计用来测试AI极限的高级安全防御环境。这不仅是技术指标的突破,更标志着AI的网络安全能力已经跨越了关键阈值,开始触及此前只有顶级人类黑客才能达到的领域。
更令人震惊的数据出现在性能增长曲线上。AISI的长期追踪显示,AI的Cyber能力翻倍周期已经压缩到4.5个月,这意味着每四个半月,AI在渗透测试、漏洞利用等网络安全任务上的表现就会翻倍。这一速度远超摩尔定律早期的芯片性能增长。报告明确指出,当前限制AI能力进一步提升的瓶颈不再是智力或算法,而是Token——即模型处理信息的窗口大小和计算资源。换句话说,只要算力供给充足,AI的进化速度还可能进一步加速。
这一发现对整个AI行业具有深远影响。首先,它打破了此前关于AI能力增长趋于平缓的普遍预期。其次,它直接挑战了现有AI安全评测体系的有效性——当AI的进化速度超过人类评测者的更新速度时,我们如何确保对AI行为的有效监控?AISI的测试本身也印证了这一点:在Mythos完成的部分复杂攻击路径中,人类专家甚至需要花费数天时间才能完全理解AI的决策逻辑。
对于AI从业者而言,这意味着我们需要重新思考AI安全研究的优先级。一方面,企业级安全防御系统必须加速升级,以应对即将到来的AI驱动的攻击手段;另一方面,模型开发者需要将安全对齐从“可选项”提升为“核心约束”,因为当能力翻倍周期缩短到4.5个月时,任何一次安全疏忽都可能在数个月内产生指数级放大的风险。正如AISI报告所暗示的,这场ASI决赛的终点可能比我们所有人预想的都要近得多。