谷歌AI一夜破9道56年数学难题，人类望尘莫及

AITNT 2026-05-26 25 14

AI 大模型深度学习技术突破

就在OpenAI刚刚推翻Erdős 80年猜想、引发数学家圈地震后，谷歌DeepMind迅速投下另一枚重磅炸弹——全新AI数学智能体AlphaProof Nexus。它一出手，就连续攻克了9道悬而未决数十年的Erdős开放问题，其中最古老的一道已困扰数学界整整56年。这不仅是AI在数学领域的又一次胜利，更意味着机器开始具备系统化解决高难度开放问题的能力，而不再只是单点突破的偶然事件。

AlphaProof Nexus的核心突破在于其混合架构：它结合了强化学习驱动的探索策略与形式化验证的严谨性。传统AI数学系统通常依赖符号计算或神经网络搜索，容易陷入局部最优或产生不可靠的结果。而AlphaProof Nexus通过自博弈机制，不断生成候选证明并利用自动定理证明器进行校验，将成功率提升了近一个数量级。在针对Erdős问题的测试中，它在9道题上均给出了可验证的完整证明，覆盖了数论、组合学与图论等多个分支。谷歌DeepMind并未公开所有证明细节，但确认其中3道题的解法已通过同行评审，剩余6道正在提交专业期刊。

这一成果对数学界和AI行业影响深远。从数学角度看，Erdős问题以高难度著称，许多题目曾让顶尖数学家耗费数十年无果。AlphaProof Nexus的批量解决，意味着AI可能成为数学家的“超级协作者”，快速扫清那些需要海量穷举或复杂推理的障碍。从技术角度看，它验证了强化学习在抽象推理领域的潜力——此前该领域主要被Transformer模型主导，而AlphaProof Nexus证明，结合搜索与验证的智能体架构在符号推理上更具优势。此外，谷歌DeepMind表示，该系统的训练成本仅为GPT-4的十分之一，但推理效率却高出三倍，这为AI在学术研究中的普及降低了门槛。

当然，AlphaProof Nexus并非万能。它目前仍依赖人类设定的问题框架，无法自主提出新猜想。但正如DeepMind首席科学家所言：“数学史上每一次工具革命都重塑了学科边界，从算盘到计算机，现在轮到AI。”对于AI从业者而言，这提示我们：强化学习与形式化验证的结合可能是通往强推理能力的钥匙。建议关注该智能体的开源计划（预计年底发布基础框架），并尝试将其应用于代码验证、算法设计等实际场景。数学的下一幕，或许不再是人类独舞。

原文链接： https://www.aitntnews.com/newDetail.html?newId=25476

本文由 Zyentor（智元界） 原创发布

查看全部原创 · 技术论坛讨论

讨论 (0 条)

登录后参与讨论