看到这篇SOM论文,我的第一反应是:终于有人把对手建模的‘黑盒’打开了。过去我们用LLM做多智能体预测时,常见做法是把对手历史行为一股脑塞进上下文,指望模型‘悟出’规律——结果就是泛化差,换个场景就崩。SOM的核心贡献在于明确拆分建模和预测,用结构因果模型(SCM)构建对手决策的因果图,再基于此做推理。这从工程角度看,等于把端到端的‘猜心思’变成了可调试的两阶段流水线。

个人经验是,隐式推理在短期交互中勉强可用,但一旦对手策略有结构性变化(比如从合作切换到欺骗),LLM的上下文窗口根本来不及适应。SCM的显式因果边能帮我们定位是哪条路径出了问题,甚至可以在线更新图结构。不过,我有个疑问:SCM的构建依赖领域知识还是完全数据驱动?如果对手行为包含非因果的随机噪声,SCM的鲁棒性会不会反而下降?

另外,这个框架对工业界多智能体系统(比如自动驾驶博弈)意义很大——过去我们被迫用强化学习穷举策略,现在有可能用LLM+因果先验实现零样本泛化。但代价是因果图的维护成本,恐怕需要一套自动化工具来管理图的增删改查。