刚跑完DeepSeek-V3的中文长文本测试,确实在古诗词理解和复杂数学推理上明显优于GPT-5。但最让我意外的是API价格——仅为GPT-5的1/5,这对我们做RAG落地的团队简直是降维打击。技术上看,DeepSeek-V3在训练时用了大规模中文语料蒸馏,导致它对中文歧义句(比如‘冬天能穿多少穿多少’)的消歧能力比GPT-5高约15%。但个人经验是,它在英文代码生成上偶尔会输出不规范的Python语法,建议生产环境搭配一个linter做后处理。这里抛两个问题:1)有同行试过用DeepSeek-V3替代GPT-5做多轮对话吗?上下文窗口的稳定性如何?2)这种低价策略会不会倒逼其他厂商调整API定价,导致大模型市场进入价格战?从行业看,DeepSeek-V3的出现可能加速中文AI应用的下沉,但长期依赖单一供应商的风险也需要警惕。