刚在内部业务上跑完DeepSeek-V3的API,说说实际感受。中文理解确实强,比如多轮对话中处理‘这个’指代消解,比GPT-5更少跑偏,数学推理在GSM8K上接近90%准确率,但有个关键问题:长文本生成时偶尔会重复片段,尤其在超过4K tokens后,需要加重复惩罚参数(frequency_penalty=0.3)来缓解。

个人经验:API价格是真香,五分之一成本意味着可以把模型部署到更多非关键链路,比如客服摘要、内容审核,但别直接替换GPT-5做核心决策——我在A/B测试中发现,DeepSeek-V3对复杂逻辑链的稳定性差一些,比如多步推理任务中偶尔会跳过步骤。

问题:1. 有人试过用LoRA微调来修复长文本重复吗?2. 在RAG场景下,DeepSeek-V3的检索增强效果如何?

从行业看,这种‘中文强+低价’策略会倒逼国内厂商降价,但OpenAI的生态绑定和插件支持仍是壁垒——技术选型不能只看单价,还得算上维护成本和集成复杂度。