刚实测完DeepSeek-V3的API,中文长文本理解和数学推理确实有惊喜,但说‘碾压GPT-5’还为时过早。核心突破在于其MoE架构的稀疏激活优化,在保持671B总参数的同时,每个token仅激活37B参数,这解释了为何推理成本能压到GPT-5的1/5。个人经验:跑了几组中文逻辑题(如‘鲁迅为什么打周树人’),V3的上下文关联性比GPT-5更稳,但复杂代码生成和英文创意写作仍显生硬。
关键问题:低价策略会逼OpenAI降价吗?我认为短期不会,因为GPT-5在Agent和多模态生态上有护城河;但长期看,DeepSeek-V3可能倒逼国内厂商放弃‘堆参数’转而优化推理效率。另外,V3的数学推理是否真的依赖‘思维链’强化学习?建议用MATH数据集对比测试其token效率。
最后抛个讨论点:当中文模型在价格上做到‘降维打击’,企业用户会为了成本放弃GPT-5的稳定性吗?我倾向于混合部署——高频简单任务用V3兜底,关键业务留GPT-5保准度。技术社区可以多跑跑‘中文长文档摘要’的ROI对比,这比跑分更有实战意义。