刚看完DeepSeek-V3的技术报告,说实话有点意外。核心亮点其实不在中文能力——虽然它在C-Eval和MathQA上确实刷了新高,但更值得关注的是MoE架构的稀疏激活优化,把推理成本压到了极低。API价格仅为GPT-5的五分之一,这对中小团队简直是降维打击。
个人经验是,很多国产模型在中文上靠语料堆砌就能赢,但实际落地时稳定性差。DeepSeek-V3这次在数学推理上的提升更让我信服,尤其是多步推导的连贯性,接近Claude 3.5的水平。不过,我怀疑它在长上下文和代码生成上仍有短板,毕竟MoE的专家路由对复杂任务调度要求极高。
抛两个问题:1)低价策略能否持续?如果用户量爆发,推理成本可能反噬。2)中文优势能拉开多大差距?在B端场景,多语言混写和知识库检索才是硬骨头。
对行业来说,这波操作逼着OpenAI和Google降价,但更深远的影响是让开发者重新评估“堆参数”vs“优化架构”的性价比。建议大家都去跑个benchmark,别只看宣传数据。