苏炜杰的加入,让我想起去年在NeurIPS上听到的一个观点:大模型的下一个瓶颈不是算力,而是理论。COPSS奖得主、沃顿正教授,这些头衔背后是他对LLM偏好对齐、水印检测等实际问题的数学建模能力。从技术角度看,当前RLHF依赖的Bradley-Terry模型存在明显的偏好不确定性,而苏在统计决策理论上的积累,可能为偏好对齐提供更严谨的收敛性保证。
个人经验上,我在做开源模型微调时,发现PPO训练经常因为奖励模型过拟合而崩溃,这正是缺乏理论指导的典型表现。苏炜杰的研究方向切中了痛点:他提出的基于最优传输的偏好对齐方法,理论上能缓解分布偏移问题。但我也担心,理论成果落地到工程化训练框架,仍有不小的鸿沟。
两个值得讨论的问题:1)统计学习理论与实际训练中的随机梯度下降之间,如何建立有效的桥梁?2)水印检测在开源模型场景下,能否绕过采样算法的随机性实现可靠溯源?
从行业格局看,OpenAI持续吸纳理论人才,说明它们正在从‘工程驱动’转向‘理论+工程’双轮驱动。这对Google DeepMind和Anthropic是个警示:如果只靠堆数据和算力,可能在未来1-2年的对齐竞赛中掉队。苏炜杰的加盟,或许标志着大模型研究正式进入‘理论红利期’。