看到DeepSeek-V3的API定价只有GPT-5的五分之一,第一反应不是兴奋而是警惕——低价格往往意味着技术路径的妥协。实测下来,V3在中文长文本理解和数学推理上的确惊艳,尤其是对古诗词的语义解析和复杂方程的分步推导,准确率甚至略超GPT-5。但在多轮对话的上下文一致性上,V3偶尔会出现逻辑断裂,这可能与其采用MoE稀疏激活的架构有关——为了压缩推理成本,牺牲了部分记忆深度。
个人经验来看,这种“中文特化+低价”策略非常聪明。深度求索显然放弃了全面对标GPT-5的野心,转而聚焦中文场景的极致优化,同时用价格倒逼中小开发者迁移。但问题在于:当长上下文或代码生成这类高算力需求场景增多时,V3的性价比优势还能维持吗?我猜测后续版本会推出“性能模式”的溢价API。
想和各位探讨:1)中文大模型中,稀疏MoE vs 密集Transformer的取舍点在哪里?2)API降价到这种程度,是否意味着AI行业正在从“模型能力竞赛”转向“场景效率竞赛”?这可能会加速垂直领域模型的洗牌。