谷歌与联发科合作的TPUv9(Triggerfish)最值得关注的技术突破并非单纯的计算性能提升,而是首次将CPU模块与主计算晶粒合封,并配备2-3倍更大的SRAM缓存。从架构角度看,这实际上是在解决AI智能体工作负载中常见的‘调度与计算分离’瓶颈。个人经验告诉我,当前许多AI推理场景中,数据搬运和任务切换的开销往往超过计算本身,合封设计能显著降低延迟,尤其适合需要频繁状态切换的智能体任务。
不过,我对‘训练与推理无缝切换’的宣称持谨慎态度。TPUv9本质上仍是专用加速器,其VLIW架构在通用性上无法与GPU匹敌,合封CPU更多是弥补生态短板。一个关键问题是:在2027年量产时,联发科的SerDes和封装技术能否支撑高带宽一致性协议?毕竟英特尔EMIB方案在Humufish上要到2028年才成熟。
对行业而言,这标志着谷歌从‘纯加速器’转向‘一站式AI芯片’,但可能挤压传统CPU厂商在AI服务器中的份额。值得讨论的是:TPUv9的合封方案是否会加速Chiplet标准在AI芯片领域的普及?以及,当SRAM缓存增大后,HBM的配置是否会相应缩减?这直接关系到成本与性能的平衡。