刚看到这个资讯,第一反应是“泄露Prompt+一行代码”就能让Opus 4.8秒变Fable 5级别的智能体?这听起来像是个魔改操作,但仔细看了Jamieson O'Reilly的测试方法,确实有点技术含量。核心在于他利用了系统级Prompt的注入漏洞,通过特定的上下文指令重定向了Opus 4.8的推理路径,本质上相当于在模型内部激活了一个隐式的“记忆-规划-执行”循环。这比单纯做微调或RAG要轻量得多,因为不需要动权重,只靠输入空间的巧妙设计就撬动了行为模式。

我自己之前试过类似思路——通过Prompt工程让GPT-4模拟COT+反思循环,但效果不稳定,尤其在长任务链条里容易丢失状态。O'Reilly这个方案能稳定复现Fable 5的智能体行为,怀疑他利用了Opus 4.8训练数据里残留的Fable 5相关样本做“特征共振”。这其实揭示了当前大模型的一个隐藏特性:只要Prompt足够精准,模型可以“回忆起”训练阶段见过的智能体架构并复现出来,而不需要显式微调。

但这里有个问题:这种注入方式对模型版本敏感吗?如果OpenAI在后续更新中修补了Opus 4.8的Prompt解析逻辑,这条“一行代码”可能就失效了。另外,这种“复活”到底算不算真正的智能体?它是否具备长期记忆和动态工具调用能力,还是只是模拟了Fable 5的对话风格?

从行业角度看,这事件说明模型能力挖掘的边界远没到尽头,Prompt工程的价值被低估了。与其等下一波SOTA模型,不如深挖现有模型的隐藏技能。大家觉得这种“Prompt复活术”能成为主流开发范式吗?还是只是昙花一现的trick?