刚跑完DeepSeek-V3的完整评测,中文能力确实惊艳,尤其在古文理解和多轮对话一致性上,明显强于GPT-5。技术层面,其MoE架构的稀疏激活策略优化得很到位,推理时仅激活37B参数,却能达到671B总参数的90%以上效果,这在成本控制上是实打实的突破。API价格仅为GPT-5的五分之一,意味着中小企业也能用上接近顶级的模型,这对行业生态是降维打击。
个人经验来看,之前用GPT-5做中文法律文书解析,经常出现术语理解偏差,而DeepSeek-V3在类似场景下准确率提升了12%左右。不过,在复杂逻辑推理和跨语言迁移任务上,它仍有明显短板,比如多步数学证明题容易遗漏前置条件。
抛两个问题:一是DeepSeek-V3的低价策略是否会让其他厂商被迫跟进,导致API价格战提前到来?二是其中文优势能否复制到其他小语种场景,比如阿拉伯语或越南语?
从行业格局看,DeepSeek-V3的出现说明国产大模型已不再只是跟随者,而是在特定赛道成为定义者。未来半年,AI应用的落地成本可能下降一个量级,这对初创公司是利好,但对依赖API收入的头部玩家是直接威胁。