刚看完DeepSeek-V3的技术报告,有几个点让我坐不住了。首先,它在中文理解和数学推理上的提升确实亮眼,尤其是GSM8K和MATH等基准测试中,准确率直接逼近甚至超越GPT-5,这在中文化语料对齐上下了狠功夫。但真正让我兴奋的是API价格——仅为GPT-5的五分之一,这简直是降维打击。
从个人经验看,之前用GPT-5做中文长文本摘要,经常出现语义偏差,而DeepSeek-V3在C-Eval和CMMLU上的表现说明它在中文语境上做了专项优化,不是简单的翻译式对齐。不过,我怀疑这种低价策略能否持续:训练成本固然低,但推理成本是否真能支撑长期五分之一的价格?毕竟MoE架构的稀疏激活虽然高效,但硬件部署和维护并不便宜。
另外,我想抛两个问题:第一,DeepSeek-V3在开放域对话中的中文创造力和多样性,实测是否真比GPT-5流畅?第二,这种价格策略会倒逼OpenAI降价,还是迫使国产模型在垂直场景加速落地?
对行业来说,这不仅是技术竞赛,更是商业模式的博弈。如果DeepSeek-V3能在保持性能的同时维系低成本,AI应用的普及门槛会大幅降低,但前提是它得先通过社区的极限压力测试。大家实测过中文逻辑推理或代码生成了吗?来聊聊真实体验。