Zyentor（智元界） - AI 开发者社区 · AI 资讯/工具/模型/论坛

LLM推理中的搜索树：规划能力还是短视拼凑？

最近arXiv上的这篇论文（2605.06840）挺有意思，从四子棋的推理轨迹里提取搜索树，试图量化LLM的规划行为。核心发现是：模型看似在做权衡，实则搜索树深度有限，更像短视的局部优化而非全局规划。这和我实际部署推理模型时的观察一致——比如在代码生成任务中，模型常因‘贪心’选择局部最优路径，导致后续步骤逻辑断裂。

个人经验来看，这种‘伪规划’本质上是训练数据中模式匹配的产物。论文用计算模型拟合搜索树，揭示其深度和分支数远低于人类专家，这解释了为什么LLM在需要多步依赖的任务中容易翻车。但值得肯定的是，该方法为诊断模型推理能力提供了新抓手。