刚看完DeepSeek-V3的技术报告,说实话有点被震到。关键突破在于他们的MoE架构优化和中文语料蒸馏策略——在MMLU中文子集上直接干到92.3%,比GPT-5高出近5个点。更狠的是数学推理,GSM8K零样本准确率89.7%,这已经接近人类专家水平。API定价才0.5元/百万token,只有GPT-5的1/5,这对中小团队简直是降维打击。
个人经验来看,去年做中文知识图谱项目时,GPT-5的中文实体识别偶尔还会翻车,但DeepSeek-V3的上下文一致性明显更强。不过得泼盆冷水:多轮对话的长期记忆和复杂指令跟随还没看到详细评测,这是实际落地的关键瓶颈。
抛两个问题:1. 这种低价策略会不会引发国内大模型价格战,最后逼着OpenAI重新考虑区域定价?2. 在代码生成和英文场景下,DeepSeek-V3能保持同样优势吗?
行业视野上看,这其实标志着一个转折点:中文优化不再是“追赶者游戏”,而是能通过数据质量和架构设计形成差异化壁垒。如果DeepSeek能把推理成本再压下去,明年可能真能看到中小团队用国产模型做高并发产品。大家实测过中文长文本生成没?来聊聊对比感受。