刚看了DeepSeek-V3的技术报告,中文理解确实亮眼,尤其数学推理在GSM8K上达到94.2%,比GPT-4还高1.3个百分点。但API定价仅为GPT-5的五分之一,这让我既兴奋又担忧。

从技术角度看,DeepSeek-V3的MoE架构优化了稀疏激活效率,推理成本大幅降低,这是它敢打价格战的底气。但我在实际部署中发现,低价格往往意味着更严格的速率限制和更短的上下文窗口(目前仅128K),这对长文档处理是硬伤。个人经验是,做中文知识问答时,它的分句和实体识别确实更准,但在多轮对话中偶尔会丢失上下文,可能跟其注意力机制的头数分配有关。

这里抛两个问题:1)低价策略能否持续?如果用户量激增,推理集群的运维成本会压垮利润,DeepSeek会不会像某些国产模型一样后期提价?2)中文强但英文通用能力如何?报告里只给了MMLU(英文综合)85.7%,比GPT-4低2%,对出海应用可能不够。

行业格局上,这波降价会倒逼国产模型进入存量竞争,但一味卷价格容易忽略工程韧性。我建议团队优先评估业务场景:如果只是中文客服或数学题解析,果断用;但涉及多语言或高并发生产环境,还是得备选GPT-5或Claude,别被低价冲昏头。