谷歌在AI硬件领域的野心再次升级。继今年4月推出针对推理优化的TPUv8i和针对训练优化的TPUv8t之后,谷歌正与联发科联手打造下一代TPUv9系列芯片。其中,代号为Triggerfish的旗舰芯片首次将CPU模块与主计算晶粒合封于同一基板,旨在同时高效处理训练和推理工作负载,为日益复杂的AI智能体应用提供一站式硬件解决方案。这一设计思路的转变,意味着谷歌不再满足于专用加速器,而是追求通用性与性能的平衡。TPUv9 Triggerfish的核心亮点在于其架构创新。联发科新增的CPU模块专门用于管理训练与推理之间的工作负载切换,从而减少延迟并提升资源利用率。此外,该芯片的SRAM缓存容量相比前代提升了2至3倍,这直接关系到AI智能体在处理长序列、多轮对话等大模型推理任务时的性能表现。根据规划,Triggerfish将于2027年第四季度进入量产,而同一系列的Humufish芯片则提前一个季度投产。这两款芯片均采用先进的HBM4E或HBM4内存,并将在2028年实现大规模出货。研究机构预计,2027年谷歌TPU总出货量将达到1000万至1100万颗,显示出其在云端AI市场的强劲需求。值得注意的是,TPUv9系列在封装工艺上做出了差异化选择。Humufish芯片将采用英特尔的EMIB封装技术,而非台积电主推的CoWoS。EMIB被认为在灵活性和成本控制上更具优势,尤其适合异构集成场景。Humufish的主计算晶粒由谷歌自行设计,而I/O和后端部分则由联发科负责。尽管有传闻称谷歌可能将部分生产转移至英特尔代工厂,但行业分析师指出,TPUv9芯片大概率仍由台积电制造,英特尔仅负责封装环节。这一策略既缓解了台积电因英伟达、AMD和苹果订单而导致的产能紧张,也为谷歌争取了更多供应链弹性。展望未来,TPUv9系列的问世将深刻影响AI基础设施的竞争格局。对于AI从业者而言,这意味着2028年后,云端训练与推理的硬件壁垒将进一步降低,开发者可以更灵活地部署从模型训练到实时推理的全流程。建议关注谷歌Cloud后续对TPUv9的定价策略和开放程度,以及联发科在AI芯片设计领域的技术积累如何转化为实际性能优势。在AI智能体快速发展的当下,谷歌与联发科的这次合作,或许正是为下一波AI应用爆发准备的硬件基石。