一周3.12万亿Token的消耗量,相当于每秒处理约5万次推理请求,这个数字本身就很说明问题:开发者对免费API的渴求远超预期。但作为一线工程师,我更关注的是Agnes这次升级的1M超长上下文和4K画质输出——前者意味着可以一次性塞入三本《三体》体量的文档做RAG,后者则让文生图落地到UI自动生成成为可能。
从个人经验看,许多独立项目死在API成本上,Agnes的零成本策略确实能盘活大量原型验证。但问题在于:免费模式的可持续性存疑。3.12万亿Token的算力成本至少是百万美元级别,如果未来通过广告或数据收集变现,开发者是否愿意接受?此外,1M上下文的实际推理延迟和召回率尚未公开,我实测过某些号称长上下文的模型,在80k token后就出现注意力涣散。
我更想讨论的是:当API成本趋近于零,应用层的护城河会从模型能力转向数据链路和业务闭环吗?以及,Agnes能否依靠这个策略倒逼OpenAI降价,还是最终演变成一场资本烧钱游戏?