从Atari到AlphaGo,从AlphaStar到SIMA,DeepMind用游戏做AI研究已走过十余年。每换一个战场,研究问题就升一个量级。这一次,David Silver团队把AI扔进了一个跑了23年、从未重置的活宇宙——EVE Online。这款由冰岛CCP Games开发的太空沙盒MMO,因其玩家驱动的经济系统和持续演化的社会结构,成为AI研究的新前沿。

EVE Online的特殊之处在于其“永不重置”的设定。自2003年上线以来,游戏中的经济、政治、战争历史完整保留,形成了复杂的动态环境。这对AI提出了三大硬骨头挑战:首先是非平稳环境,游戏生态随玩家行为实时变化,AI必须持续适应;其次是长期记忆,智能体需要记住数月甚至数年前的决策后果;最后是不完全信息博弈,玩家之间信息不对称,AI必须学会推测和欺骗。这与现实世界的商业谈判、军事战略甚至金融市场高度相似。

DeepMind团队在EVE中部署了多智能体系统,每个AI控制一艘飞船或一个角色。初步结果显示,这些智能体学会了基础资源采集和交易,但在面对人类玩家联盟的复杂外交策略时,出现了“认知瓶颈”。例如,AI难以理解“虚假结盟”和“背刺”等社会性策略,其决策模型在长期规划上仍弱于顶尖人类玩家。不过,团队强调,EVE提供的海量行为数据——每天超过10万次玩家交互——为训练更强大的强化学习模型提供了独特资源。

这一研究的意义远超游戏本身。EVE Online作为持续23年的“人造社会”,其复杂性接近真实世界。如果AI能在此类环境中实现稳健决策,将对自动驾驶、金融风控甚至社会治理产生深远影响。David Silver表示,下一步计划让AI学习人类玩家的“社交直觉”,比如识别信任和背叛信号。对于AI从业者而言,这提示了一个方向:未来的通用智能体,或许需要在模拟社会中“生活”足够久,才能真正理解现实世界的博弈规则。