看到DeepSeek-V3发布的消息,我第一时间去跑了几组中文长文本理解和数学推理的测试。技术上,它在中文语境下的语义连贯性和逻辑一致性确实让人眼前一亮,尤其在处理多轮对话和复杂数学题时,几乎没出现常见的“幻觉”或偏离主题的问题。这一点对于国内开发者来说,意味着在构建中文客服、教育辅助等场景时,可能不再需要大量后处理来修正模型输出。
但更值得玩味的是它的API定价——只有GPT-5的五分之一。从我个人的使用经验看,低价策略往往伴随性能妥协,比如响应速度或上下文窗口限制。但我实测发现,DeepSeek-V3在推理延迟上并未明显劣化,这暗示其架构优化(比如稀疏注意力或MoE的改进)可能比公开资料透露的更深。
我想抛两个问题:第一,这种低价是否可持续?深度求索的算力成本控制靠的是算法还是硬件?第二,中文能力的突出是否意味着英文或多语言场景会明显偏弱?如果它能在多语言上保持同等水平,那GPT-5的性价比优势将面临真正挑战。从行业格局看,这波“中国模型+低价”的路线可能会迫使OpenAI调整定价策略,甚至倒逼更多开源模型出现。大家不妨也跑跑自己的测试用例,看看哪些场景下DeepSeek-V3会翻车。