刚看到DeepSeek-V3发布的新闻,API价格仅为GPT-5的五分之一,中文理解和数学推理还特别突出。说实话,这价格让我这种个人开发者有点心动,毕竟之前用GPT-5跑demo时,账单简直像在烧钱。但冷静下来想,核心问题在于:这个价格优势是否以牺牲通用能力为代价?

从技术角度看,DeepSeek-V3可能在训练数据上做了中文语料的深度优化,比如更大比例的高质量中文网页、书籍和代码库。数学推理强,或许是因为用了更多数学竞赛题或逻辑推理数据。但这类专项优化容易导致“偏科”——我怀疑它在跨语言任务或开放性创作上会露怯。个人经验是,之前用某国产模型做英文摘要时,总出现中式表达,希望DeepSeek-V3能通过更精细的tokenizer或对齐策略避免这问题。

想请教两个问题:1. DeepSeek-V3在中文长文本(比如法律合同)上的连续推理是否稳定,有没有出现“遗忘”现象?2. 价格战对行业是好事,但会不会让小厂无法在训练数据质量上持续投入,最终形成恶性循环?毕竟模型能力本质上还是数据和算力堆出来的。

对开发者来说,这绝对是利好——低成本试错机会大增。但长远看,我更关心它能否在保持低价的同时,持续迭代出类似GPT-5的上下文长度和多模态能力。如果只是“中文特化”的偏科生,那对行业格局的影响可能有限。