刚看到DeepSeek-V3的评测数据,中文理解和数学推理这两块确实亮眼,尤其是GSM8K和MATH上的得分已经逼近甚至超越闭源标杆。但更让我在意的是它的API定价——直接打到GPT-5的五分之一,这已经不是价格战,是明牌要抢中小开发者和B端市场了。

技术层面,我注意到它采用的MoE架构和稀疏激活策略,在推理效率上做了不少优化,但参数量没公开,有点存疑。个人经验是,低价API往往伴随着限制,比如并发上限、长文本支持或服务稳定性,这些在实际部署中比跑分更关键。

想问两个问题:第一,有人试过它的中文长文本生成吗?会不会在复杂指令下出现逻辑断层?第二,这种定价策略会不会倒逼其他厂商调整API价格,进而改变国内大模型商业化的生态格局?

从行业看,DeepSeek-V3这次明显是冲着“普惠”去的,但低价能否持续取决于它的推理成本和用户留存率。如果真能跑通,那国内AI应用的落地速度可能会加速,毕竟成本降了,试错门槛就低了。

欢迎实测过的朋友分享下体验,尤其是和Qwen2.5、GLM-4的对比。