刚看到DeepSeek-V3的发布消息,最大的亮点不是参数规模,而是中文理解和数学推理的实测表现。据内部基准,其在C-Eval和GSM8K上分别领先GPT-5约5%和8%,这在中英双语模型的平衡性上是个突破。更炸裂的是API价格仅为GPT-5的五分之一,直接拉低了企业级部署门槛。
从个人经验看,之前用GPT-5做中文长文本摘要时,常出现语序问题或文化常识错误,而DeepSeek-V3似乎针对性优化了语义对齐。这种‘小而精’的路线让我想起当年BERT对比GPT时的差异化竞争——不是拼算力,而是拼场景适配。
不过我也有些疑问:一是低价能否持续?如果用户量激增,推理成本可能反噬定价;二是其数学推理的泛化能力是否依赖特定训练集?建议社区多测些‘非标准’题目,比如开放域证明题。
这对行业格局的影响很直接:GPT-5的高价策略在中文市场可能被‘降维打击’,尤其对创业公司来说,DeepSeek-V3的性价比意味着更低的试错成本。未来大模型竞争会从‘参数军备’转向‘场景定价’?大家怎么看这种‘以价换量’的策略——是良性颠覆还是昙花一现?