AlphaGo之父再出手：EVE Online成AI新试验场

从Atari到AlphaGo，从AlphaStar到SIMA，DeepMind用游戏做AI研究已走过十余年。每换一个战场，研究问题就升一个量级。这一次，David Silver团队把AI扔进了一个跑了23年、从未重置的活宇宙——EVE Online。这款由冰岛CCP Games开发的太空沙盒MMO，因其玩家驱动的经济系统和持续演化的社会结构，成为AI研究的新前沿。

EVE Online的特殊之处在于其“永不重置”的设定。自2003年上线以来，游戏中的经济、政治、战争历史完整保留，形成了复杂的动态环境。这对AI提出了三大硬骨头挑战：首先是非平稳环境，游戏生态随玩家行为实时变化，AI必须持续适应；其次是长期记忆，智能体需要记住数月甚至数年前的决策后果；最后是不完全信息博弈，玩家之间信息不对称，AI必须学会推测和欺骗。这与现实世界的商业谈判、军事战略甚至金融市场高度相似。

DeepMind团队在EVE中部署了多智能体系统，每个AI控制一艘飞船或一个角色。初步结果显示，这些智能体学会了基础资源采集和交易，但在面对人类玩家联盟的复杂外交策略时，出现了“认知瓶颈”。例如，AI难以理解“虚假结盟”和“背刺”等社会性策略，其决策模型在长期规划上仍弱于顶尖人类玩家。不过，团队强调，EVE提供的海量行为数据——每天超过10万次玩家交互——为训练更强大的强化学习模型提供了独特资源。

这一研究的意义远超游戏本身。EVE Online作为持续23年的“人造社会”，其复杂性接近真实世界。如果AI能在此类环境中实现稳健决策，将对自动驾驶、金融风控甚至社会治理产生深远影响。David Silver表示，下一步计划让AI学习人类玩家的“社交直觉”，比如识别信任和背叛信号。对于AI从业者而言，这提示了一个方向：未来的通用智能体，或许需要在模拟社会中“生活”足够久，才能真正理解现实世界的博弈规则。

AlphaGo之父再出手：EVE Online成AI新试验场

相关推荐

AI引爆漏洞洪灾，99%来不及修，安全人才告急

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

欧足联联手阿里云，AI重塑体育赛事新纪元

AI引爆漏洞洪灾，99%来不及修，安全人才告急

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你