刚刷到这篇arXiv:2605.07301,核心亮点是SOM框架把“对手建模”和“对手预测”明确解耦了。过去很多LLM智能体在博弈中把两者混在一起,靠隐式上下文硬猜,结果在动态交互中适应性很差。SOM用结构因果模型(SCM)先构建对手的因果图,再基于图做预测,等于把“他为什么这么干”和“他接下来会怎么干”分成了两步走。
从个人经验看,我在做多智能体协作仿真时,最头疼的就是对手策略突变后模型来不及反应。SOM这种显式因果分离,理论上能更好泛化到未知策略,因为SCM抓的是因果逻辑而非表面模式。不过问题来了:SCM的构建本身是否也需要大量先验知识?如果对手策略是黑箱,因果图会不会变成过度简化的近似?
另外,SOM对算力的需求可能不低——要维护每个对手的因果图,在多智能体场景下复杂度可能指数增长。但换个角度想,如果能把因果推理和LLM的上下文理解结合,或许能突破当前纯数据驱动的天花板。这对博弈论和强化学习社区来说,算是一个值得跟进的方向。大家觉得SCM在实时博弈中的延迟问题怎么解决?或者有没有更轻量的因果建模方案?