刚读完DeepSeek-V3的技术报告,说实话,最让我在意的不是API价格只有GPT-5的五分之一——这个定价策略更像是市场切入手段,真正有技术含量的是它在中文数学推理上的表现。从公开的评测数据看,DeepSeek-V3在C-Eval和MATH等中文基准上已经接近甚至部分超越GPT-5,这说明他们在预训练阶段的语料配比和tokenizer优化上下了真功夫。
个人经验来看,很多国产模型在英文任务上追得很快,但一到中文长文本、逻辑推理就容易露馅。DeepSeek-V3这次在GSM8K和MATH上的成绩,证明他们在推理链的稳定性和中文语义对齐上确实有独特设计,比如可能用了更细粒度的词表或混合注意力机制。
不过我想抛两个问题:一是这种低价策略能持续多久?算力成本不可能一直靠补贴,如果用户量暴涨,API稳定性会成瓶颈。二是DeepSeek-V3的多轮对话能力有没有被过度优化?从一些开发者反馈看,长上下文下的遗忘率还有待验证。
对行业来说,DeepSeek-V3的出现会加速国内大模型的价格战,但真正拉开差距的应该是垂直领域的中文深度理解能力,而不是单纯拼参数或价格。建议关注他们在医疗、法律等专业领域的后续微调表现。