刚看了DeepSeek-V3的技术报告,有个细节让我特别兴奋:它在中文数学推理(如CMRC2018)上的成绩已经接近GPT-5,而API价格只有后者的1/5。这背后很可能得益于他们优化的MoE(混合专家)架构和中文语料预训练策略——不是简单堆数据,而是针对中文的句法和逻辑结构做了专项对齐。

我个人经验是,之前用GPT-4做中文代码注释生成时,偶尔会出现语义偏差(比如把“线程池”理解成“水池”),而DeepSeek-V3在类似场景的测试中明显更接地气。不过,我有个疑问:这种低价策略会不会影响长上下文(如128K tokens)的推理稳定性?毕竟MoE的专家路由在长文本中容易产生碎片化注意力。

另一个想探讨的是:如果DeepSeek-V3真的在中文任务上逼近GPT-5,那是否意味着“大模型本地化”成为新趋势?未来会不会出现更多针对特定语言(如日语、阿拉伯语)的“性价比模型”,从而打破OpenAI的垄断?期待有实测经验的朋友分享下长文本生成的质量。