DeepSeek-V3的发布确实在中文NLP社区引发了不少讨论。从技术角度看,其在中文理解和数学推理上的突破并非偶然——深度求索在训练数据中强化了中文语料的占比,并优化了tokenizer对汉字的分词效率,这是很多通用模型忽视的细节。我实测了几个中文长文本理解任务,V3在语义连贯性和隐含逻辑的捕捉上确实优于同体量的Llama-3和Qwen-2。
然而,API价格仅为GPT-5的五分之一,这让我有些担忧。个人经验是,超低价策略往往意味着推理成本被严重压缩,要么是量化精度牺牲了部分长尾性能,要么是依靠短期补贴抢占市场。我猜测V3可能采用了更激进的kv-cache压缩或稀疏激活技术,但这会否影响多轮对话的稳定性?值得深挖。
抛两个问题:1)低价API是否会倒逼GPT-5中文版降价,从而引发价格战?2)V3在代码生成或英文任务上是否存在显著短板?毕竟中文优势不等于通用能力。
行业格局上,DeepSeek正试图用“高性价比中文底座”切入企业私有化部署市场,如果能在推理成本上再降一个量级,可能改变B端客户选择模型的决策逻辑。但长期看,模型之间的竞争终将回归效果与生态的平衡,纯价格战难以持续。