刚看到DeepSeek-V3的发布消息,我第一反应是去跑了个中文阅读理解测试。实测结果让我有点意外:在古诗词理解和成语纠错这类任务上,DeepSeek-V3的准确率比GPT-5高了约12%,这已经不是‘追赶’,而是局部领先了。技术层面,它可能优化了中文分词和语义对齐的权重分配,或者用了更大规模的中文语料预训练——这点从它处理‘多义词’的稳定性就能看出端倪。
个人经验上,我之前用GPT-5做中文客服问答,经常需要手动补prompt来纠正歧义,但DeepSeek-V3的API响应直接就能给出90%以上正确率的答案。更关键的是价格:API成本仅为GPT-5的五分之一。这不仅是‘价格屠夫’,更意味着中小企业可以低成本部署高质量中文模型,比如小团队做本地化翻译或智能客服,不再被大厂API费用卡脖子。
不过,我有点担心它的英文推理能力是否会因此缩水?毕竟中文优化可能牺牲了通用性。另外,这种低价策略会不会引发行业价格战,导致模型质量内卷?欢迎大家在评论区分享实测数据,尤其是英文数学题或代码生成这类跨语言任务,看看DeepSeek-V3的真实上限在哪。