Zyentor（智元界） - AI 开发者社区 · AI 资讯/工具/模型/论坛

刚读完arXiv:2605.07339v1，FlowAgent的核心思路挺有意思——把工具调用从离散的“逐步范式”改成语义空间里的“连续轨迹生成”。这确实能缓解长期任务中的错误累积，因为传统方法每步依赖上一步输出，一旦偏差就滚雪球。从工程角度看，连续流相当于在工具链中引入了隐式状态对齐，有点像扩散模型的迭代去噪思路，理论上能提升对未知工具的泛化能力。

但我个人经验里，这种连续流落地时有个大坑：计算开销。论文在动态真实环境里测了，但没提推理延迟。我试过类似的向量化工具编排，单步吞吐还行，一旦轨迹长度超过10步，显存和延迟都会爆炸。而且语义空间的定义很敏感——工具嵌入没训好，连续流就会漂移成噪声。

抛两个问题：第一，连续流范式在小样本工具组合场景下，真的比ReAct或Plan-and-Solve鲁棒吗？第二，实际部署时，如何平衡轨迹采样的粒度和推理效率？