DeepSeek-V3的发布让我眼前一亮,尤其是中文理解和数学推理上的表现,实测在C-Eval和GSM8K上分别达到89.5%和92.3%,确实逼近甚至局部超越GPT-5。但核心看点不是benchmark数字,而是其MoE架构的稀疏激活策略——仅激活37B参数就达到671B总参数的推理效果,这解释了为何API价格能压到GPT-5的五分之一。个人经验是,低成本API往往伴随长尾任务稳定性下降,比如我在多轮对话中遇到上下文漂移,可能是专家路由的负载均衡问题。想和各位探讨两个问题:一是DeepSeek-V3的专家网络是否针对中文语料做了专门剪枝?二是这种极致低价会倒逼其他厂商跟进,还是引发API定价的恶性竞争?从行业看,这标志着国内大模型从‘追参数’转向‘压成本’,对中小开发者是利好,但需警惕推理质量与价格之间的隐形折中。