AI圈再次迎来标志性的人才流动。Transformer论文作者之一、知名AI研究员Noam Shazeer在社交媒体宣布正式加入OpenAI。他在声明中写道:“我很兴奋地分享,我将加入OpenAI,并期待与那里出色的团队合作。”对于普通用户来说,Shazeer可能不是高频出现的名字,但在大模型行业,他几乎站在所有关键故事的交汇处。ChatGPT里的那个“T”来自Transformer,而Shazeer正是2017年论文《Attention Is All You Need》的八位作者之一。OpenAI从Google挖走的,不只是Gemini的一位负责人,更是一位亲手参与搭建现代大模型底层技术的人。
Shazeer的职业生涯始于2000年加入Google,是最早的员工之一。他最初从事搜索和广告系统相关工作,包括拼写纠错、广告文本排序、垃圾邮件检测等。转折发生在Google Brain时期,他从应用工程转向基础研究。2017年,他参与撰写的Transformer论文提出用注意力机制取代循环网络和卷积网络,让模型训练更易并行,规模可继续变大。此后,GPT、BERT、Claude、Gemini等大模型都沿袭这条技术路线。Shazeer还提出过Mixture of Experts、Multi Query Attention、Adafactor等技术方向,直接影响今天大模型训练和推理的效率。
Shazeer与Google的关系历经波折。2018年,他与研究员Daniel De Freitas合作开发了对话AI项目Meena,一个26亿参数的神经对话模型,在“合理性和特异性平均”指标上领先同类产品。但Google因内容安全风险未将其推向公众。Shazeer对此不满,认为Meena有机会替代Google搜索并创造巨大商业价值。2021年,他离开Google创立Character.AI。该产品让用户与AI角色聊天,迅速获得大量用户。2023年3月,Character.AI完成1.5亿美元A轮融资,a16z领投,估值达10亿美元,移动应用首周下载量超170万次。然而,高用户活跃度也带来高昂推理成本,收入与成本长期紧张。
Shazeer加入OpenAI,可能加速下一代大模型技术的研发。他的Transformer架构经验、Mixture of Experts等效率优化技术,以及Character.AI的对话产品设计经验,都可能为OpenAI带来新思路。对于AI从业者而言,这次人才流动再次印证了顶尖技术人才在行业竞争中的核心价值。未来,OpenAI能否借助Shazeer的加入,在模型效率和对话体验上实现突破,值得持续关注。