姚顺宇揭秘：预训练未撞墙，AI前沿全靠信念

一周前，张小珺录制了一期与姚顺宇的播客。28岁的姚顺宇，清华物理系特奖出身、斯坦福物理博士，本科研究凝聚态理论，博士跨向高能理论物理，因觉得领域内“老登”太多，于2024年9月转行AI，加入Anthropic参与Claude开发，一年后跳槽Google DeepMind，直接参与Gemini 3 Deep Think模型研发。这段4小时的对话，几乎每10分钟就有一个亮点，让我在回北京的夜火车上从头听到尾，整理出13个值得关注的观点。预训练撞墙是行业共识？Ilya在2024年12月NeurIPS上公开宣布“预训练即将终结”，将数据比作AI的“化石燃料”，称人类已撞到“peak data”。但姚顺宇直接否定：未来4个月看不到撞墙迹象。他认为，认为规律到头无非三种可能：适用范围真到头、某个条件不满足（如数据不够），或者“工作里有bug没发现”。绝大多数撞墙的人属于第三种。在Anthropic、Google、OpenAI内部，预训练反而越来越强，因为御三家有“修补Bug”的成体系机制。一线研究员与外界的认知，差出一整个量级。Scaling Law是经验规律而非科学规律。姚顺宇举例如下：热力学第一、第二定律被发现时也是经验规律，后来才慢慢知道微观机制。今天的Scaling Law相当于18世纪的热力学——能用、能预测，但微观机制至今无人完全说清。整个AI行业底层建立在一堆“我们也不知道为什么会这样”的经验上，这与普通人想象的精密、严谨、有完整理论支撑的AI相去甚远。AI研究员摸黑走路，信念史无前例重要。当被问及如何处理bug时，姚顺宇回答：“这更像一个信念的问题。当你遇到bug觉得不能解除，就会说这个到头了；当你觉得肯定可以解决，就觉得还没到头。”前沿研究员每天面对一堆没人见过的现象、解释不清的实验结果，每一步都得自己判断是bug还是规律本身的边界。判断错了，整个项目方向可能跑偏；判断对了，可能再往前推一大步。外面看着光鲜，里面是很黑的——一群非常聪明的人靠经验、靠直觉、靠信念，在一片没有路标的地方往前摸索。姚顺宇还直言：“AI这个事儿本来也不太需要脑子，真的不太需要脑子。需要什么？这个行业最重要的特质就是靠谱，做事细，对自己做的事负责任。”一个Google DeepMind一线研究员公开宣称自己这行“不需要脑子”，在国内AI圈几乎不会有人敢这么讲。他的逻辑是AI是个巨大的系统，预训练、后训练、数据、infra、评估，每一环都有大量细节。一个研究员只盯自己手上的指标好看，不考虑改动对全局的影响，整个系统就会出问题。这种一线视角，比任何宏大叙事都更值得从业者深思。

姚顺宇揭秘：预训练未撞墙，AI前沿全靠信念

相关推荐

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首

苹果智能眼镜或复制手表策略，剑指2000亿眼镜市场

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首