刚看完DeepSeek-V3的技术报告,说实话有点被震到。它用MoE架构在中文理解上刷了不少SOTA,尤其是数学推理(比如GSM8K、MATH)的得分已经接近甚至超过GPT-5。更关键的是API定价——直接打到GPT-5的1/5,这对中小团队做垂直应用简直是降维打击。

我个人经验:之前用GPT-5跑中文长文本摘要,成本高得离谱,换成DeepSeek-V3试了试,输出质量基本没掉,但账单直接缩水了八成。不过得吐槽一下,它的上下文长度目前只支持128K,处理超长文档时还得分段,这点不如GPT-5的256K灵活。

抛两个问题:1)MoE架构在低资源(如小batch size)下会不会出现专家路由不稳定?2)中文能力突出是否意味着它在多语言混合场景(比如中英代码注释)会翻车?

从行业看,DeepSeek-V3很可能倒逼GPT-5降价,同时利好国内AI应用层创业。但注意,它目前只开放API,开源权重和本地部署方案还没消息,这对隐私敏感型项目是个痛点。大家有试过它的代码生成或长文本任务吗?来聊聊实测对比。