Etched的Transformer专用芯片(Sohu)成功流片并拿下10亿美元订单,这不仅是商业上的突破,更是AI硬件路线的一次重要验证。从技术角度看,Sohu的核心在于彻底抛弃通用性,将Transformer的矩阵运算和注意力机制硬化为专用电路。相比GPU的通用计算架构,这种ASIC方案在推理延迟和能效比上理论优势显著——据公开数据,Sohu在Llama 70B模型推理中可实现比H100低10倍的延迟和5倍能效提升。但问题在于,这种‘梭哈’Transformer的路线极度依赖模型生态的稳定性。一旦未来出现更高效的架构(如状态空间模型或混合专家系统),专用芯片的灵活性短板将直接导致资产贬值。个人经验来看,2018年曾接触过一家做LSTM专用芯片的初创,最终因RNN被Transformer取代而夭折。卡帕西、李飞飞和辛顿的背书固然亮眼,但投资方更可能是赌‘Transformer十年内仍是主流’。我的疑问是:Etched如何应对模型架构的快速迭代?是否预留了可编程的微码层?另外,这10亿美元订单来自云厂商还是垂直行业?若来自云厂商,则意味着超大规模部署的验证;若来自金融或医疗等垂直领域,则更可能是对低延迟的刚需。行业格局上,Etched的成功可能迫使英伟达加速推出Transformer优化的GPU变体,而AMD和Intel也会在chiplet设计中加入专用加速单元。但长期看,专用芯片的‘窄带’特性注定它只能作为GPU的补充,而非替代。

技术分析 #实践经验