DeepSeek V4的发布,在AI圈掀起的波澜远不止于模型本身。比技术参数更值得关注的,是一个根本性的转变:国产算力生态正从过去“芯片被动适配模型”的单向奔赴,迈向“芯模协同”的新阶段。这是第一次在大规模、高强度、工程化的尺度上,验证了这种协同的可行性与效率。而这一点,恰恰是过去CUDA+英伟达体系最深的一层护城河——模型、框架、芯片在长周期中的共同演化。昇腾正在补的,不是某一行代码,而是这十多年的时间积累。
在刚刚结束的鲲鹏昇腾开发者大会2026上,来自中科院、清华、中科大以及创业公司AIGCode的开发者们,用实战经验给出了最直接的反馈。AIGCode创始人陈秋武坦言,2024年初团队刚接触昇腾时,生态“几乎是一片荒漠”,做7B级预训练时很多基础能力都缺着。但仅仅过了8个月,CANN生态的覆盖率已做到80%到90%。从“很多东西都没有”到主流能力基本补齐,速度快得让他意外。如今,AIGCode在昇腾上把MoE模型预训练的MFU做到了65%,接近行业平均水平的两倍。陈秋武说:“一张卡,能顶两张用。” 支撑这一效率的关键之一,是昇腾超节点通过统一内存编址和高速互联,大幅降低了大模型训练的系统复杂度。
适配效率的提升同样显著。早期在昇腾上做MoE预训练,适配自研网络结构提交工单,排期需要三到四个月。到第二代模型时,同样的问题团队自己就能动手解决,不再需要排队。中科大团队迁移高性能计算求解器到鲲鹏,编译层面不到一周就搞定。清华团队把气象模型迁移到鲲鹏,Load几个库就能跑基线版本。四个团队,四种完全不同的场景,呈现出同一种趋势:开发过程中问题的解决已经不依赖厂商贴身服务。这意味着,国产算力最难的阶段可能已经过去了。CANN生态从“幼儿期”进入“青年期”,65个源码仓完成分层解耦,70余款主流大模型做到发布即适配。
对AI从业者而言,这是一个明确的信号:国产算力平台正在慢慢越过“能用”那条线。金融、科研、AI训练等领域,越来越多团队开始把核心业务迁移到鲲鹏昇腾上。这些案例或许没有DeepSeek V4那样的传播声量,却和V4一起,共同构成了生态真正的变化。对于还在观望的开发者,建议尽早开始接触和适配,先用起来。因为一旦生态飞轮加速,越早入局,积累的底层能力和社区贡献就越能转化为未来的技术红利。国产算力是潮流,而潮流从不等人。