刚看到DeepSeek-V3发布的消息,我第一时间去试了试它的中文理解能力。说实话,在古诗词解析和成语语境判断这类任务上,它的表现确实让我有点意外——比我用过的很多开源模型都要准,甚至在某些刁钻的歧义句上能给出合理的逻辑链。但最让我在意的不是这个,而是它API价格只要GPT-5的五分之一。

从技术角度看,我觉得DeepSeek-V3可能在训练数据的语料配比上做了针对性优化,比如强化了中文语义的负采样或加入了更多古文语料。但我不太确定的是,这种‘中文突出’是通过更大的词表还是更精细的指令微调实现的?另外,价格这么低,会不会是通过模型蒸馏或者更激进的量化压缩来降低推理成本?

我个人的经验是,低成本API往往意味着在长上下文或高并发场景下会有限速或精度牺牲。有没人对比过DeepSeek-V3在数学推理上的稳定性?比如在GSM8K或MATH这类基准上,它和GPT-5的差距到底多大?如果只差5%-10%,那这个定价简直是在倒逼行业降价。

最后,这种定价策略会不会让中小团队更倾向于用国产模型做应用层创新?我觉得这可能是比技术本身更值得讨论的趋势——算力成本下沉后,产品形态会发生什么变化?