一周前,张小珺录制了一期与姚顺宇的播客。28岁的姚顺宇,清华物理系特奖出身、斯坦福物理博士,本科研究凝聚态理论,博士跨向高能理论物理,因觉得领域内“老登”太多,于2024年9月转行AI,加入Anthropic参与Claude开发,一年后跳槽Google DeepMind,直接参与Gemini 3 Deep Think模型研发。这段4小时的对话,几乎每10分钟就有一个亮点,让我在回北京的夜火车上从头听到尾,整理出13个值得关注的观点。预训练撞墙是行业共识?Ilya在2024年12月NeurIPS上公开宣布“预训练即将终结”,将数据比作AI的“化石燃料”,称人类已撞到“peak data”。但姚顺宇直接否定:未来4个月看不到撞墙迹象。他认为,认为规律到头无非三种可能:适用范围真到头、某个条件不满足(如数据不够),或者“工作里有bug没发现”。绝大多数撞墙的人属于第三种。在Anthropic、Google、OpenAI内部,预训练反而越来越强,因为御三家有“修补Bug”的成体系机制。一线研究员与外界的认知,差出一整个量级。Scaling Law是经验规律而非科学规律。姚顺宇举例如下:热力学第一、第二定律被发现时也是经验规律,后来才慢慢知道微观机制。今天的Scaling Law相当于18世纪的热力学——能用、能预测,但微观机制至今无人完全说清。整个AI行业底层建立在一堆“我们也不知道为什么会这样”的经验上,这与普通人想象的精密、严谨、有完整理论支撑的AI相去甚远。AI研究员摸黑走路,信念史无前例重要。当被问及如何处理bug时,姚顺宇回答:“这更像一个信念的问题。当你遇到bug觉得不能解除,就会说这个到头了;当你觉得肯定可以解决,就觉得还没到头。”前沿研究员每天面对一堆没人见过的现象、解释不清的实验结果,每一步都得自己判断是bug还是规律本身的边界。判断错了,整个项目方向可能跑偏;判断对了,可能再往前推一大步。外面看着光鲜,里面是很黑的——一群非常聪明的人靠经验、靠直觉、靠信念,在一片没有路标的地方往前摸索。姚顺宇还直言:“AI这个事儿本来也不太需要脑子,真的不太需要脑子。需要什么?这个行业最重要的特质就是靠谱,做事细,对自己做的事负责任。”一个Google DeepMind一线研究员公开宣称自己这行“不需要脑子”,在国内AI圈几乎不会有人敢这么讲。他的逻辑是AI是个巨大的系统,预训练、后训练、数据、infra、评估,每一环都有大量细节。一个研究员只盯自己手上的指标好看,不考虑改动对全局的影响,整个系统就会出问题。这种一线视角,比任何宏大叙事都更值得从业者深思。