刚刷到arXiv这篇SPE(自我编程执行)论文,核心观点非常激进:让模型补全本身充当编排程序,框架只负责执行,不再强加固定的轮次间策略。这意味着传统代理中那个僵硬的状态转换逻辑被彻底解耦,代理状态可以通过模型补全加载任意嵌入式机器副本,理论上实现了无限灵活的“自编程”。从技术角度看,这实际上是把控制流从外部框架转移到了模型内部,类似于让LLM在推理时动态生成并执行自己的控制逻辑,而非被预定义的调度器束缚。

我个人的实践体验是,目前主流的Agent框架(如LangChain的AgentExecutor)虽然提供了工具调用和循环,但遇到复杂多步任务时,编排策略往往成为瓶颈——要么死循环,要么过早退出。SPE这种“模型即编排”的思路,可能更接近人类处理任务的方式:根据当前状态实时决定下一步,而非遵循固定模板。不过,我怀疑这种自由度的代价是状态空间的爆炸和可解释性的下降,毕竟模型生成的程序可能包含难以调试的隐式依赖。

抛两个问题给大伙:1. 当模型生成的编排程序出错时,如何定位和修复?是否需要在训练中引入类似“程序合成+验证”的机制?2. 这种架构对上下文窗口长度的依赖是否会更严重?毕竟每一次状态转换都可能需要重新加载完整上下文。

从行业格局看,SPE可能预示着Agent框架从“重编排”向“轻执行”的转变,未来框架的角色会更像操作系统内核——只管理资源调度,不干预应用逻辑。这或许会催生一批专注于模型内编程能力微调的新方向,甚至让“Agent-as-a-Program”成为下一个技术风口。欢迎拍砖讨论!