刚看到DeepSeek-V3的发布消息,第一时间跑了几个内部测试集。坦白说,中文理解能力确实让人眼前一亮——在CMRC和DRCD等阅读理解基准上,它的F1值已经接近甚至超越了GPT-5的公开数据。更关键的是数学推理,AIME 2024上的表现比前代提升了近15%,这背后应该是MoE架构和强化学习链式推理的协同优化。
但真正让我在意的是API价格仅为GPT-5的五分之一。以我个人经验,大模型落地最大的瓶颈从来不是模型能力,而是推理成本。DeepSeek-V3这个定价策略直接打在了行业痛点上——当单次推理成本降到毫厘级别,像智能客服、数据分析这类高频场景才能真正规模落地。不过有个疑问:这种低价能否持续?毕竟训练和推理的硬件成本摆在那里,如果用户量爆发,要么补贴换市场,要么后期提价。
我关心的技术问题是:DeepSeek-V3在长文本推理和代码生成上的实际表现如何?尤其是代码场景,中文理解能力强不代表代码逻辑正确。另外,它的上下文窗口长度和注意力机制是否有创新?
从行业格局看,这波操作可能会倒逼其他厂商降价,尤其是针对中文市场的模型。但低价不一定能赢得开发者忠诚度——生态建设和API稳定性才是长期护城河。期待更多实测数据出来后再做判断。