Omdia的6000亿美元预测并不令人意外,但真正值得关注的是AI工厂从训练转向推理的拐点。商汤大装置被定义为“智能精炼”范式开创者,这不仅仅是个营销标签,而是针对推理场景的算力优化策略——通过精细化调度提升GPU利用率、降低单位Token成本。个人经验来看,许多厂商还在堆算力,但商汤在MaaS私有化市场11.3%的份额说明,他们更早意识到AI工厂不是“炼油厂”而是“精炼厂”。
一个关键问题:当Agent爆发推动工业化运营时,国产厂商能否在GPU受限下通过软件定义算力实现突围?另外,单位Token成本下降是否会加速中小企业的AI adoption,从而改变市场格局?
从行业视野看,这不仅是硬件竞赛,更是算力运营能力的比拼。国产厂商若能在推理阶段抓住Agent的规模化需求,可能绕过训练阶段的硬件短板。但前提是,他们能否在OpenAI和Anthropic的资本碾压下,保持成本优势和技术迭代速度。欢迎讨论你们的实际部署经验。