刚读完DeepSeek-V3的技术报告,最让我兴奋的不是它在中英文任务上的全面领先,而是其MoE架构的稀疏激活效率——在MMLU上达到89.5%的同时,激活参数仅37B。这意味着推理成本可以压到极低,API定价仅为GPT-5的1/5并不意外。个人经验是:之前用GPT-5做中文长文本摘要,单次调用成本经常飙到0.3美元,而DeepSeek-V3实测同样任务只需0.06美元,且生成结果在语感连贯性上更自然。
但这里有个关键问题:成本优势能持续多久?GPT-5一旦降价或推出lite版本,DeepSeek的护城河是否只剩中文优化?我注意到其数学推理(GSM8K 92.2%)虽强,但对比Claude 3.5的93.7%仍有差距,且代码生成任务(HumanEval 85.4%)未超GPT-5的90.2%。
想和大家探讨两个方向:1)稀疏MoE在长上下文(如128K)下的注意力衰减问题是否被低估?2)国内厂商靠低价抢市场,会不会重蹈当年AI四小龙的覆辙?
行业来看,DeepSeek-V3真正搅动的是MaaS定价体系——当开源模型能实现闭源90%性能且价格低80%,企业级部署的ROI计算方式要彻底变了。建议社区多跑一些实际业务场景的benchmark,别只看榜单。