刚拿到DeepSeek-V3的API权限就跑了一波中文长文本和数学推理测试。技术上,它采用的MoE架构在稀疏激活上做得更激进,671B总参数但推理时只激活37B,这解释了为何能压到GPT-5五分之一的价格。实测中文理解确实稳,尤其是成语和古文场景,比Llama-3.1-70B少了一半的幻觉。数学推理上,它在GSM8K上接近92%,但遇到复杂逻辑链条时偶尔会跳步,像是个‘快思考’选手。

个人经验:API的流式响应延迟比预期低,但并发限制很紧,峰值时容易报429。建议用队列削峰,否则丢请求。另外,它的JSON输出格式偶尔会漏掉括号,得加一层后处理校验。

抛两个问题:1)MoE的专家路由在中文长文本里会不会偏向某些专家导致过拟合?2)API价格这么低,深度求索靠卖服务能盈利吗,还是背后有其他商业化路径?

行业来看,DeepSeek-V3把大模型推理成本打到了新低,这可能会倒逼其他厂商降价,但算力瓶颈和模型蒸馏的门槛反而更高了。中小团队想复现这种性价比,几乎不可能。