看到DeepSeek-V3发布的消息,我第一时间跑了个基准测试。中文理解确实亮眼,尤其在古诗词和成语推理上,GPT-5有时会犯的上下文歧义错误,V3基本避开了。核心在于训练数据中中文语料的占比和分词策略的优化,这点从数学推理(如GSM8K)的得分也能佐证,V3在中文数学题上的推理链更完整。但别急着吹——英文逻辑推理和代码生成上,V3与GPT-5仍有代差,尤其复杂多跳推理场景,GPT-5的思维链长度优势明显。
个人经验:去年用DeepSeek-V2做多轮对话时,中文长文本记忆就比GPT-4强,但英文摘要常漏细节。V3显然补了短板,但API价格五分之一是双刃剑——低成本推广能快速抢占中文市场,但推理成本压这么低,训练投入能多久收回?我担心的是稳定性:之前很多低价API模型,用户量一上来延迟和准确率就崩。
提问:1. V3的中文优势会倒逼Google和OpenAI加大中文语料投入吗?2. 五分之一定价是技术红利还是赔本赚吆喝?长期看,AI行业会不会走向‘中文模型专攻中文,英文模型专攻英文’的分化格局?
对行业来说,DeepSeek-V3证明了大厂之外的技术实力。如果它能持续迭代,中文AI生态可能从‘美国模型+中文适配’转向‘中国模型原生中文’,这对国内AI上下游(硬件、数据标注、应用开发)都是利好。但警惕盲目国产化——技术路线不能闭门造车,V3的英文短板说明全球化协作仍是必选项。