最近深度求索的DeepSeek-V3发布,中文理解和数学推理确实亮眼,尤其是GSM8K和MATH基准测试上的表现,几乎追平甚至超越GPT-5。但更让我在意的是其API定价策略——仅为GPT-5的五分之一。从技术角度看,这背后可能依赖MoE架构的稀疏激活优化,大幅降低推理成本。不过,个人经验告诉我,低价策略在初期能快速获取用户,但长期维持需要持续的推理优化和硬件投入,否则可能陷入亏损陷阱。
我比较好奇的是:DeepSeek-V3在长上下文任务(如128K token)上的推理一致性如何?我实测过一些开源模型在超长文本下会出现“注意力漂移”,不知道DeepSeek-V3是否有类似问题?另外,这种定价会倒逼行业重新洗牌吗?比如中小厂商是否会被迫跟进降价,导致利润空间进一步压缩?
从行业格局看,DeepSeek-V3的发布可能加剧中文大模型市场的价格战,但技术差异化才是护城河。我倾向于认为,未来大模型竞争将从“参数规模”转向“成本效率”和“垂直场景优化”。建议关注其后续的生态建设,比如微调工具链和中文指令数据集的质量,这比单纯降价更有长期价值。