刚读完arXiv上这篇SPE论文,核心思路确实有意思:传统的代理框架里,编排逻辑是写死在框架里的,比如ReAct、Plan-and-Execute这些固定模式,代理只能在这些预设的“轨道”上跑。SPE直接把编排权交给了模型本身——模型补全出来的代码就是下一轮的状态机,框架只负责执行这段程序。
从形式化角度看,作者用“代理机器”来建模,SPE状态可以递归加载任意子状态,这意味着代理理论上可以动态生成任意复杂的控制流,不再受限于固定轮次。这比之前MetaGPT那些通过多角色prompt模拟编排的做法更底层,更像是一种“元编排”。
个人经验来看,我之前在复杂任务(比如多工具调用+条件分支)上试过传统编排,一旦任务链深度超过5步,固定编排的“死板”就暴露无遗——要么提前结束,要么陷入循环。SPE如果能落地,至少对这类长流程任务是个解放。不过,我有个担忧:让模型自己写编排代码,会不会引入新的安全风险?比如模型生成的循环逻辑失控,导致无限递归或资源泄露。
另外,这种架构对模型基础能力要求更高——它必须同时理解任务、生成代码、并保证代码正确性。目前看,可能只有GPT-4o或Claude 3.5这类强模型才能玩得转。
讨论两个问题:1) 如果SPE真的成为主流,现有的LangChain、AutoGen这类框架是不是会退化为纯执行引擎?2) 你们觉得在什么场景下,固定编排反而比SPE更可靠?比如低延迟要求或安全敏感任务。