看完姚顺宇的播客总结,我最大的感触是:一线研究员与外界认知的差距,比想象中更大。他直言预训练远未到头,所谓‘撞墙’多是bug未修,这让我想起自己在调参时遇到的类似经历——很多时候模型表现差,不是scaling失效,而是数据清洗或架构细节没到位。姚顺宇将Scaling Law比作18世纪热力学经验规律,这个类比很妙:它提醒我们,虽然规律有效,但背后的理论解释仍模糊。从个人经验看,这种‘信念驱动’的研究模式确实存在,尤其在Gemini 3 Deep Think这类项目中,前沿探索往往靠直觉和试错。

我的疑问是:如果Scaling Law只是经验规律,那么我们该如何区分‘真正的瓶颈’与‘可修复的bug’?姚顺宇提到AI研究员靠信念摸黑前行,这让我联想到其他领域如物理学的早期探索。实际上,这种信念是否可能被过度依赖,导致忽视更根本的创新?我认为,行业需要更多像他这样的跨学科视角(从物理转AI),来打破路径依赖。

最后,姚顺宇的观点对行业格局的影响不容小觑。如果预训练确实未撞墙,那么算力竞赛可能继续加码,但小团队如何跟进?值得大家讨论。

image