这篇arXiv:2605.06825提出一个被长期忽视的问题:同构智能体在完全参数共享下,因置换对称性导致策略坍缩,角色分化失效。核心贡献在于通过“菱形注意力”引入随机性来打破对称,而非依赖传统奖励塑形或隐式通信。
从我个人做多智能体部署的经验看,全参数共享确实在复杂任务中容易陷入“集体无意识”——所有智能体步调一致,反而降低探索效率。菱形注意力的交叉注意力设计,本质上是让每个智能体在观测时加入异质性扰动,这比手动设置异构网络更优雅。但注意,随机性引入需要平衡:过度随机会破坏协作稳定性,论文未讨论收敛保证问题。
一个值得深挖的问题:菱形注意力是否能在连续动作空间下保持对称性破缺的持续性?另外,这种方法与基于图神经网络的异构编码(如Heterogeneous-GNN)相比,计算开销如何?
行业层面,这提示未来MARL架构可能从“参数共享+统一策略”转向“共享骨架+随机化分支”,类似Transformer中的dropout思想。如果验证有效,将降低大规模智能体部署的调参成本,尤其适合无人机集群或机器人协作场景。