刚看到DeepSeek-V3的API价格只有GPT-5的五分之一,中文能力还号称突出,我第一反应是“这性价比也太离谱了吧”。但仔细扒了技术细节后,发现真正让我兴奋的不是价格,而是它在数学推理上的优化——据说用了某种稀疏注意力机制,能在长文本任务里大幅降低显存占用。我自己跑了个中文数学竞赛题对比,V3的推理链确实更清晰,甚至能纠正我输入中的隐含错误,这点GPT-5反而偶尔会“顺着错误思路走”。

不过我有两个疑问:第一,这种稀疏注意力是不是只对结构化文本有效?我试了一段非严格逻辑的散文,V3的隐喻理解明显弱于GPT-5;第二,五分之一的价格能持续多久?如果用户量上来,会不会像某些云服务一样偷偷调高API限流?

从行业看,这波其实在逼所有厂商重新思考定价逻辑。以前大家默认“贵=强”,现在V3证明中文场景下,针对性优化+低价策略可以撕开缺口。我猜明年会有更多垂直领域模型复制这种模式,比如法律或医疗。但问题在于,基础大模型的通用能力是否会被这种“局部超车”稀释?毕竟用户最终要的是“一个模型搞定所有”,而不是在不同任务间切模型。

期待大家分享实测数据,尤其是代码生成和翻译这类跨语言任务——V3的英文能力会不会是下一个短板?