顾煜贤加入DeepSeek的消息在圈内引发了不少讨论。作为长期关注对话系统技术演进的从业者,我认为这不仅是人才流动的个案,更折射出当前对话AI领域竞争格局的深层变化。顾煜贤师从黄民烈教授,其交互式AI课题组在可控文本生成和情感对话方面有扎实的工作,特别是苹果博士奖学金和蚂蚁In-Tech奖学金的双重背书,说明他在学术和工程落地上都有建树。从技术角度看,DeepSeek此举显然是瞄准了下一代对话系统的“交互智能”瓶颈——现有模型在上下文理解、多轮一致性上仍有明显短板,而顾煜贤的研究方向恰好切中要害。我个人经验是,很多团队在对话模型优化时过度依赖RLHF和提示工程,忽略了底层表征学习的交互性设计,这恰恰是学术前沿与工业界结合最薄弱的环节。值得追问的是:DeepSeek是否会借此机会在情感计算或个性化对话上押注?以及,国内顶尖AI人才加速流向产业界,是否意味着高校在基础研究上的“造血能力”正在被稀释?从行业视野看,这种人才流动短期会强化头部企业的技术壁垒,但长期可能加剧学界与业界的断层。对话AI的下一个突破点,或许就藏在顾煜贤这样的“跨界者”手中。
清华特奖得主顾煜贤加入DeepSeek:对话AI的“人才军备竞赛”才刚刚开始
全部回复
共 3 条刚看完这个帖子,感觉你对顾煜贤加入DeepSeek的分析挺到位的。我比较好奇的是,你提到现有模型在上下文理解和多轮一致性上有短板,这确实是很多对话系统实际落地时让人头疼的点。顾煜贤他们在可控文本生成和情感对话上的工作,具体是怎么切入这些问题的?比如,是从训练数据层面做文章,还是改模型架构本身?我最近也在看一些多轮对话的论文,感觉很多方法在短对话上效果还行,但一拉长到十几轮,模型就开始“失忆”或者前后矛盾,这好像是个普遍难点。
另外,你说很多团队过度依赖RLHF和提示工程,忽略底层表征学习的交互性设计,这个观点我挺同意的。不过想请教一下,你觉得交互性设计具体指什么?是像把对话历史编码得更结构化,还是引入一些类似记忆网络的机制?或者有没有可能从强化学习的奖励函数里直接建模这种交互性,而不是只靠最终回复的好坏来打分?我自己的理解是,现在很多模型其实还是“单轮回应”的思维,没真正把对话当作一个动态过程来建模,顾煜贤的研究方向如果能打破这个瓶颈,确实挺值得期待的。
最后想问问,DeepSeek在情感对话这块有公开的布局或者产品方向吗?我印象里他们之前更多是推底层推理优化和开源模型,突然在交互智能上招人,是不是意味着要往C端应用发力了?
交互式AI课题组在可控文本生成上的积累确实很有价值,但我觉得DeepSeek挖他更看重的是情感对话那块——毕竟现在产品都在拼拟人化体验,而多轮一致性问题再靠RLHF和提示工程硬调,收益已经肉眼可见地递减了。顾煜贤在底层表征交互性上的思路,说不定真能捅破这层窗户纸,就看团队给他的资源能不能支撑从学术论文到产品级系统的工程化落地了。
老实说,顾煜贤这个选择挺有意思的。黄民烈组在可控文本生成上的积累确实硬核,但对话系统的多轮一致性光靠底层表征学习恐怕还不够,实际落地时上下文丢失和知识冲突才是真痛点。我猜DeepSeek是想借他的背景在交互式RLHF上找新解法,不过光补学术短板可能不够,工程侧的推理延迟和成本控制才是拦路虎。