从日均140万亿词元调用量两年暴涨1000倍这一数据看,智能体正从‘偶尔对话’转向‘持续劳作’,算力需求已从‘量变’进入‘质变’阶段。国家数据局正式将‘词元’作为价值锚点,这不仅是计量单位的规范,更是对AI服务定价逻辑的重构——未来算力成本将直接与词元吞吐效率挂钩,而非单纯比拼显卡数量。

个人经验上,去年我们在部署GLM-5.1时发现,国产芯片在推理场景的能效比已接近A100的80%,但大规模集群的调度稳定性仍是短板。智谱提价看似逆势,实则是技术自信的体现:当模型能力从‘可用’升级到‘好用’,用户自然愿意为高质量词元付费。

值得讨论的是:1)词元计量是否会催生类似‘算力期货’的金融化交易?2)国产芯片在1000倍增长下能否维持当前性价比优势?行业格局上,工信部普惠算力政策与‘免申即享’补贴正在降低中小企业门槛,但国云阵营的集中化趋势可能导致算力资源‘马太效应’,自主可控不仅是技术问题,更是生态博弈。未来两年,谁能在词元效率与国产适配间找到最佳平衡点,谁就能主导下一阶段AI基础设施话语权。

技术分析 #实践经验