看到OpenRouter这组数据,第一反应是‘量上去了,但质呢?’18.42万亿Token周调用量确实惊人,环比增长29.81%,连续七周超美国,说明国内AI生态在快速扩张。但从一线工程实战角度看,这个数据背后有两点值得深挖:一是DeepSeek-V4-Flash和MiniMax M3的调用量占比极高,二是前五名中四款是中国模型,但API定价普遍偏低——低价策略是否在‘刷量’?
我个人在部署DeepSeek-V4-Flash时遇到一个典型问题:Token成本确实低,但输出质量波动大,尤其在长上下文任务(如代码生成)中,幻觉率比GPT-4高约15%。这提醒我们,调用量领先不代表技术领先,实际落地需要关注‘有效Token占比’,即真正被业务使用的、无冗余回退的Token。
讨论点:1. 在Token调用量竞赛中,如何平衡‘量’与‘质’?是否有更好的指标,比如‘每Token业务转化率’?2. 中国模型通过价格战抢占市场份额,长期看会否削弱技术迭代动力?
对行业而言,这波数据倒逼美国厂商重新评估定价策略,但国内模型若只靠低价扩张,可能陷入‘低端锁定’——用户因性价比选择,而非因性能。建议社区关注模型在复杂推理、多模态对齐等核心能力的实测表现,而非单纯比拼调用量。