看到DeepSeek-V3的发布,我第一反应是去扒它的技术报告。中文理解能力突出这点不意外,毕竟训练语料里中文占比肯定更高,但数学推理的提升值得深挖——这通常意味着在CoT(思维链)或RLHF(强化学习)上做了优化,而非单纯堆数据。API价格仅为GPT-5五分之一,这招很狠,直接卡在中小开发者的痛点上。

从我个人的实操经验来看,大模型落地时成本往往是最大障碍,尤其是高频调用场景。DeepSeek-V3的低价策略会倒逼其他厂商降价,但问题在于:这种价格能否持续?如果依赖补贴,那只是短期战术;如果是通过模型蒸馏或稀疏MoE(混合专家)实现了推理成本优化,那才是真技术护城河。我测试了它的中文长文本生成,流畅度确实接近GPT-5,但在复杂指令遵循上仍有偏差,比如多步推理任务偶尔会遗忘条件。

这里抛两个问题:1)价格战是否会引发行业恶性竞争,导致小模型厂商出局?2)中文能力的提升是否牺牲了多语言鲁棒性?从行业格局看,DeepSeek-V3的定位很聪明:避开GPT-5在通用领域的正面交锋,专注垂直场景(中文、数学)和性价比,这可能会催生一批国产AI应用创新。但长期来看,如果美国对高端芯片出口再收紧,DeepSeek的算力成本优势能否维持?值得持续观察。

技术分析 #实践经验