Transformer作者Noam Shazeer正式加入OpenAI

AI圈再次迎来标志性的人才流动。Transformer论文作者之一、知名AI研究员Noam Shazeer在社交媒体宣布正式加入OpenAI。他在声明中写道：“我很兴奋地分享，我将加入OpenAI，并期待与那里出色的团队合作。”对于普通用户来说，Shazeer可能不是高频出现的名字，但在大模型行业，他几乎站在所有关键故事的交汇处。ChatGPT里的那个“T”来自Transformer，而Shazeer正是2017年论文《Attention Is All You Need》的八位作者之一。OpenAI从Google挖走的，不只是Gemini的一位负责人，更是一位亲手参与搭建现代大模型底层技术的人。

Shazeer的职业生涯始于2000年加入Google，是最早的员工之一。他最初从事搜索和广告系统相关工作，包括拼写纠错、广告文本排序、垃圾邮件检测等。转折发生在Google Brain时期，他从应用工程转向基础研究。2017年，他参与撰写的Transformer论文提出用注意力机制取代循环网络和卷积网络，让模型训练更易并行，规模可继续变大。此后，GPT、BERT、Claude、Gemini等大模型都沿袭这条技术路线。Shazeer还提出过Mixture of Experts、Multi Query Attention、Adafactor等技术方向，直接影响今天大模型训练和推理的效率。

Shazeer与Google的关系历经波折。2018年，他与研究员Daniel De Freitas合作开发了对话AI项目Meena，一个26亿参数的神经对话模型，在“合理性和特异性平均”指标上领先同类产品。但Google因内容安全风险未将其推向公众。Shazeer对此不满，认为Meena有机会替代Google搜索并创造巨大商业价值。2021年，他离开Google创立Character.AI。该产品让用户与AI角色聊天，迅速获得大量用户。2023年3月，Character.AI完成1.5亿美元A轮融资，a16z领投，估值达10亿美元，移动应用首周下载量超170万次。然而，高用户活跃度也带来高昂推理成本，收入与成本长期紧张。

Shazeer加入OpenAI，可能加速下一代大模型技术的研发。他的Transformer架构经验、Mixture of Experts等效率优化技术，以及Character.AI的对话产品设计经验，都可能为OpenAI带来新思路。对于AI从业者而言，这次人才流动再次印证了顶尖技术人才在行业竞争中的核心价值。未来，OpenAI能否借助Shazeer的加入，在模型效率和对话体验上实现突破，值得持续关注。

Transformer作者Noam Shazeer正式加入OpenAI

相关推荐

Plaud出货200万台，AI硬件订阅年收入破1亿美元

大卫·霍克尼88岁离世，他如何用AI重塑艺术边界

九章云极建AI流水线：算力度量成新基建

Plaud出货200万台，AI硬件订阅年收入破1亿美元

大卫·霍克尼88岁离世，他如何用AI重塑艺术边界

📖 更多原创