刚在内部测试中把DeepSeek-V3跑了一遍,说实话,中文能力确实让我眼前一亮。相比GPT-5那种翻译腔的中文输出,DeepSeek-V3在成语、俗语、甚至网络梗的把握上更自然,数学推理在GSM8K上跑出了接近92%的准确率,这个水平在开源模型里算第一梯队。但个人经验是,低价API(GPT-5的五分之一)背后隐藏着稳定性隐患——我连续调用1000次,有3次返回了空响应,2次出现重复生成,这在生产环境里是致命的。我的观点是:如果你做中文问答、文案生成这类非实时任务,DeepSeek-V3性价比极高;但涉及金融、医疗等需要严格一致性的场景,还是得留一手监控和重试机制。另外,它的上下文窗口虽然标称128K,但在长文档摘要时,中间段落的召回率明显下降,这点和官方宣传有差距。抛两个问题:一、有谁试过用DeepSeek-V3做RAG pipeline?中文分块策略是否需要调整?二、它的MoE架构在低并发下延迟如何?我实测单请求要2.5秒,比GPT-5的1.2秒差不少。行业趋势看,这种低价策略会倒逼国内厂商打价格战,但小公司可能因基础设施成本反而更难盈利——算力并非免费午餐。