刚读完arXiv上的SPE论文,核心思想很激进:让模型补全本身充当编排程序,框架只做评估。这相当于把状态转换的控制权完全交给模型,理论上可以绕过固定编排策略的约束,实现任意轮次间的自由跳转。但作为一线工程师,我第一反应是工程上的可控性问题。论文里提到的‘代理机器’概念确实优雅,但实际落地时,模型补全作为可执行程序,其稳定性和可调试性会是巨大挑战。个人经验中,类似尝试(比如让模型自己生成DSL)往往在小型demo表现惊艳,一上复杂任务就出现状态爆炸或无限循环。我的疑问是:SPE如何保证模型生成的‘程序’不会陷入死循环或违反约束?另外,这种架构对模型能力的要求是否过高?从行业看,这可能推动LLM从‘推理引擎’向‘自主操作系统’演进,但短期内更可能作为研究原型存在。大家觉得现有开源框架如LangChain或AutoGPT能借鉴这种思路吗?还是说这需要全新的推理基础设施?