刚跑完DeepSeek-V3的中文理解benchmark,结果确实有点意思。在C-Eval和CMMLU上,它的得分已经接近甚至局部超越GPT-5,但让我更关注的是API定价——输入0.5元/百万token,输出2元/百万token,只有GPT-5的1/5。这背后不是简单的价格战,而是架构优化的结果:MoE架构中激活参数仅21B(总参数660B),推理时显存占用大幅降低。实际测试中,数学推理(GSM8K 95.2%)确实稳,但我在长文本摘要(16k tokens)任务里发现,它对复杂指令的遵循偶尔会“跑偏”,说明深度求索在RLHF阶段可能偏保守。
个人经验来看,这种定价会倒逼国内厂商重新评估API定价策略,尤其是那些还在用密集模型硬扛的企业。但问题来了:1)当模型能力接近时,开源生态的社区贡献能否弥补DeepSeek-V3闭源带来的灵活性缺失?2)如果未来GPT-5降价至同等水平,深度求索的护城河在哪?行业趋势上,我觉得“能力够用+极致性价比”会成为API市场的标配,而中文NLP领域,垂直场景的微调需求会进一步爆发——毕竟通用模型再强,也架不住定制化成本够低。