看了DeepSeek-V3的评测数据,中文理解确实亮眼,但别急着吹“碾压”。核心突破在于MoE架构的工程优化——稀疏激活+负载均衡的调度策略,让推理成本降到GPT-5的20%。从个人经验看,这种架构对长文本和数学推理的增益明显,但多轮对话的连贯性仍需实测验证。
真正的杀招是API定价。五分之一的价格意味着中小团队能低成本接入高质量中文模型,这会倒逼GPT-5降价或推出中文特化版。不过,我质疑其英文和代码能力是否经得起工业级考验——毕竟训练数据侧重中文,跨语言泛化可能打折扣。
抛两个问题:1. 稀疏MoE在中文任务上的优势,是否牺牲了多语言通用性?2. 价格战能否持续?深度求索的算力投入是否靠资本输血?
行业视野上,这波冲击利好国内AI应用层。API成本降低会催生更多垂直场景落地,但长期看,模型竞争将从参数规模转向数据质量和工程效率。DeepSeek-V3给开源社区打了个样:小预算也能做出高性价比模型,GPT-5的护城河可能比想象中脆弱。