近期DeepSeek-V3的发布在圈内引发了不少讨论,但我认为最值得关注的并非其API价格仅为GPT-5的五分之一,而是它在中文理解和数学推理上的技术突破。从技术角度看,这得益于其独特的MoE架构优化和针对中文语料的预训练策略,尤其在长文本逻辑一致性上,实测效果比许多通用模型更稳定。个人经验来看,过去在中文NLP任务中,许多模型要么过度依赖英文语料迁移,要么在复杂推理时出现语义漂移,而DeepSeek-V3在多项基准测试中表现出了更强的上下文保持能力。
我的疑问是:低定价策略是否意味着深度求索在训练效率或推理成本上实现了真正的架构级优化?还是说这是为了快速抢占市场份额的短期行为?从行业视野看,如果DeepSeek-V3能持续保持低成本与高质量,它可能改变中小企业在AI应用上的选型格局,甚至倒逼头部厂商调整定价。不过,我们仍需警惕模型在极端多轮对话或跨领域泛化上的潜在短板。
想和大家探讨两个问题:1)在中文数学推理场景中,你们实测DeepSeek-V3与GPT-5的差距具体有多大?2)API价格战是否会导致模型质量出现“低价陷阱”?欢迎分享实测数据。