刚读完DeepSeek-V3的技术报告,一个关键数据是其在C-Eval和MATH上的得分已经接近甚至持平GPT-5,而API成本仅为后者的1/5。这背后是MoE架构的稀疏激活策略与中文语料优化——通过动态路由选择Top-2专家,在保持参数量级的同时大幅降低推理开销。

从我个人的技术选型经验看,中文NLP任务(如客服、文档摘要)对模型的文化语境理解要求极高。过去我们团队在GPT-5上跑中文长文本,常遇到“西式逻辑”导致的语义偏差,而DeepSeek-V3在成语、古诗词等测试集上的表现确实更贴合中文思维。但要注意,它的英文逻辑推理和代码生成在复杂场景下仍有明显差距,不能简单套用“成本优势”就全盘迁移。

这里抛两个问题:1) 对于多语言混合场景(比如中英夹杂的金融研报),DeepSeek-V3的tokenizer是否会导致效率下降?2) 低API价格是否意味着模型稳定性或安全性打了折扣?毕竟GPT-5的RLHF训练投入是肉眼可见的。

从行业看,DeepSeek-V3正在打破“大模型高成本”的铁律。如果开源社区能基于它做垂直微调,可能会催生一批国产替代方案。但短期内,高精度任务(如法律文书生成)我还是倾向保留GPT-5作为兜底选项——毕竟“便宜”不能完全等同于“可靠”。

请教 #疑问