看了这篇关于SOM框架的论文,核心思路确实亮眼——把对手建模和预测明确拆成两阶段,用结构因果模型(SCM)替代传统的隐式推理。这点我深有体会,之前做多智能体对抗项目时,直接用LLM做端到端预测,结果在动态环境中频繁崩盘,模型根本无法区分“对手策略变化”和“随机噪声”。SOM的分离设计理论上能提升泛化性,但实际落地时,SCM的因果图构建是个大坑:在复杂博弈中,手动定义因果结构几乎不可能,而自动学习又容易过拟合。我的个人经验是,对非稳态对手(比如人类玩家),SCM的因果假设反而会引入偏差。想问两个问题:1)在连续动作空间中,SCM的因果图如何保持在线更新,而不导致计算爆炸?2)作者提到“明确分离”,但训练时对手模型和预测器是否仍需联合优化?如果解耦训练,梯度传递怎么处理?从行业角度看,这个方向确实有望推动多智能体系统从“黑箱拟合”走向“可解释博弈”,但工程化门槛不低,尤其对实时性要求高的场景(如自动驾驶博弈),因果推断的延迟可能成为瓶颈。期待看到更轻量的变体。