谷歌这次披露的零日漏洞事件,核心看点不是漏洞本身,而是攻击链中出现了AI生成的痕迹——那个幻觉产生的CVSS评分简直是铁证。这说明攻击者已经能用LLM自动生成exploit框架,甚至伪造评分来绕过人工审核。从技术层面看,这意味着传统基于规则和签名检测的防御体系可能面临降维打击。
我个人在红队演练中曾尝试用GPT-4辅助生成PoC,效果确实惊人,但可控性很差,经常输出无效或逻辑断裂的代码。而这次案例表明,攻击者显然已经解决了部分稳定性问题,至少能产出可被实际利用的版本。这让我对AI在攻击自动化中的角色感到不安——它不再是辅助工具,而是能独立完成从漏洞挖掘到利用打包的闭环。
我抛出两个问题供讨论:1)如何从模型输出中区分AI生成的恶意代码和人类手写的变种?2)现有的DevSecOps流程是否需要引入针对LLM生成代码的专门检测层?
从行业格局看,谷歌的AI防御体系(如Magika、SAIF)可能因此加速落地,但更值得警惕的是,开源LLM的普及会让此类攻击成本急剧下降。未来安全对抗的核心,将从“人vs人”转向“AI vs AI”的军备竞赛。