Mozilla今天发布了一篇引爆技术圈的深度复盘博文:Firefox团队借助Anthropic的Claude Mythos Preview模型,在短短一个月内修复了423个安全漏洞。这个数字有多夸张?2025年Firefox平均每月修复21.5个漏洞,而4月的修复量超过了此前15个月的总和。更令人震惊的是,这些漏洞中包括180个高危(sec-high)级别、80个中危和11个低危,其中有一个HTML legend元素漏洞藏了15年,还有一个XSLT相关的bug已经存在了整整20年。
Mozilla安全工程师Brian Grinstead在博文中坦言,Mythos找到的沙箱逃逸漏洞数量已经超过了人类安全研究员的总和。沙箱逃逸是浏览器安全领域最难啃的骨头——浏览器把每个网页隔离在沙箱中运行,攻击者即便控制了网页也无法逃出,而沙箱逃逸就是找到方法从这个隔离区越狱,获得更高权限。这类漏洞连Fuzzing都很难覆盖,Mozilla的Bug Bounty计划给沙箱逃逸开出的最高赏金是2万美元,是整个赏金体系的天花板。Mythos的解法非常硬核:它会自己写一段恶意补丁注入沙箱进程,然后用这段代码去攻击浏览器最安全的部分,整个过程需要创造性思维和对多进程架构的深度理解。
模型变强只是故事的一半。Mozilla团队从2月开始与Anthropic合作,最初用Claude Opus 4.6在Firefox 148中修复了22个漏洞。但真正的转折点是Agentic Harness工程框架的出现。这套系统的核心逻辑包括:给模型一段代码让它找Bug、模型编写测试用例动态验证假设(能复现的才算数)、自动与已知漏洞比对去重、最后进入正式的安全Bug生命周期。团队一开始在终端里手动盯着模型跑调Prompt,跑通后就并行化到多台临时虚拟机上同时运行,每台VM负责扫描一个特定文件或函数。更妙的是,Pipeline搭好后换模型只需一行代码,从Opus 4.6切到Mythos Preview几乎无缝衔接,每次模型升级整条Pipeline的效果都会同步放大。
不过,找到漏洞只是第一步。Brian Grinstead说得很直白:每一个Bug都需要人工修复。4月修复的423个漏洞中,271个由Mythos直接发现,41个来自外部安全研究员,剩余111个由内部团队通过其他模型和模糊测试等方式发现。100多名工程师连夜加班,手动修复每一个漏洞。这提醒我们,AI在安全领域是强大的辅助工具,但真正的安全防线依然需要人类工程师的智慧和耐心。对于AI从业者而言,Agentic Harness的工程思路值得借鉴——模型能力与工程框架的乘法效应,才是真正释放AI潜力的关键。