OpenAI于6月24日正式发布了与博通合作研发的首款自研AI推理芯片Jalapeño,这一动作标志着这家AI巨头在硬件自主化道路上迈出了关键一步。Jalapeño是一款专用集成电路(ASIC),专为处理ChatGPT等大型语言模型的推理任务而设计,而非用于模型训练。推理任务指的是模型处理用户请求、生成回复或运行Codex等代理程序的过程,这是OpenAI日常服务中最核心的算力消耗环节。
从技术细节来看,Jalapeño的诞生仅用了九个月时间,距离OpenAI首次披露与博通的合作意向不过短短数月。这一快速进展背后,是OpenAI对英伟达GPU供应紧缺的主动应对。博通首席执行官陈福阳表示,Jalapeño在性能上已达到与英伟达Blackwell系列及谷歌Tensor处理单元相当的水平。早期测试结果更显示,Jalapeño在能效比(每瓦特性能)方面将显著优于当前业界最先进水平,这对于降低大规模AI服务的运营成本至关重要。
值得注意的是,Jalapeño并非孤例。微软、Meta和亚马逊等AI头部企业近期也相继推出了定制化AI芯片,主要用于服务器端的模型训练或推理运算。然而,这些芯片在综合性能上仍与英伟达产品存在一定差距。OpenAI将Jalapeño定位为多代计算平台的首个里程碑,计划于2026年底前完成部署。这一时间表表明,OpenAI不仅希望减少对单一供应商的依赖,更意在通过自研芯片构建长期的技术护城河。
对于AI从业者而言,Jalapeño的发布释放了一个明确信号:随着大模型应用场景的爆发,推理效率将成为下一阶段竞争的核心焦点。建议关注ASIC架构在特定任务上的能效优势,以及OpenAI后续芯片迭代对行业价格和生态的影响。同时,博通在定制芯片领域的深厚积累,也可能为其他云计算厂商提供类似的合作范式。未来两年,AI芯片市场的格局或将迎来新一轮洗牌。