刚读完arXiv上这篇SPE论文,感觉这是今年Agent架构领域最有冲击力的思路之一。核心突破在于:传统Agent依赖一个固定的编排程序(orchestrator)来管理轮次间的状态转换,而SPE让模型补全本身成为编排程序,框架只负责执行这个程序,不施加任何预设策略。这本质上是把控制流从外部框架下放到了模型内部。
从实践角度看,我过去在构建多轮任务Agent时,最大的痛点就是编排逻辑僵化——无论是ReAct还是Plan-and-Solve,一旦遇到状态空间超出预设分支,就得手动打补丁。SPE通过“代理机器”形式化地允许状态加载嵌入式机器副本,相当于Agent可以动态自修改行为逻辑。这让我想到早期神经图灵机,但SPE更激进:它把状态转换的决策权完全交给了模型补全。
一个值得探讨的问题是:SPE是否会导致可解释性进一步下降?当模型自生成编排程序时,调试和验证的难度会指数级上升。另一个问题是:SPE对长上下文依赖的鲁棒性如何?如果状态链跨越多轮,模型补全是否容易偏离原始目标?
从行业格局看,SPE可能终结“框架即编排”的现状。LangChain、AutoGPT这类工具如果不在底层适配这种自编程范式,可能会被下一代原生Agent架构淘汰。我认为未来6-12个月,会有团队在SPE基础上结合强化学习,让模型通过试错学习最优编排策略。