DeepSeek V4引爆芯模协同，国产算力生态加速跨越“能用”门槛

AITNT 2026-05-29 33 11

AI 大模型深度学习技术突破

DeepSeek V4的发布，在AI圈掀起的波澜远不止于模型本身。比技术参数更值得关注的，是一个根本性的转变：国产算力生态正从过去“芯片被动适配模型”的单向奔赴，迈向“芯模协同”的新阶段。这是第一次在大规模、高强度、工程化的尺度上，验证了这种协同的可行性与效率。而这一点，恰恰是过去CUDA+英伟达体系最深的一层护城河——模型、框架、芯片在长周期中的共同演化。昇腾正在补的，不是某一行代码，而是这十多年的时间积累。

在刚刚结束的鲲鹏昇腾开发者大会2026上，来自中科院、清华、中科大以及创业公司AIGCode的开发者们，用实战经验给出了最直接的反馈。AIGCode创始人陈秋武坦言，2024年初团队刚接触昇腾时，生态“几乎是一片荒漠”，做7B级预训练时很多基础能力都缺着。但仅仅过了8个月，CANN生态的覆盖率已做到80%到90%。从“很多东西都没有”到主流能力基本补齐，速度快得让他意外。如今，AIGCode在昇腾上把MoE模型预训练的MFU做到了65%，接近行业平均水平的两倍。陈秋武说：“一张卡，能顶两张用。” 支撑这一效率的关键之一，是昇腾超节点通过统一内存编址和高速互联，大幅降低了大模型训练的系统复杂度。

适配效率的提升同样显著。早期在昇腾上做MoE预训练，适配自研网络结构提交工单，排期需要三到四个月。到第二代模型时，同样的问题团队自己就能动手解决，不再需要排队。中科大团队迁移高性能计算求解器到鲲鹏，编译层面不到一周就搞定。清华团队把气象模型迁移到鲲鹏，Load几个库就能跑基线版本。四个团队，四种完全不同的场景，呈现出同一种趋势：开发过程中问题的解决已经不依赖厂商贴身服务。这意味着，国产算力最难的阶段可能已经过去了。CANN生态从“幼儿期”进入“青年期”，65个源码仓完成分层解耦，70余款主流大模型做到发布即适配。

对AI从业者而言，这是一个明确的信号：国产算力平台正在慢慢越过“能用”那条线。金融、科研、AI训练等领域，越来越多团队开始把核心业务迁移到鲲鹏昇腾上。这些案例或许没有DeepSeek V4那样的传播声量，却和V4一起，共同构成了生态真正的变化。对于还在观望的开发者，建议尽早开始接触和适配，先用起来。因为一旦生态飞轮加速，越早入局，积累的底层能力和社区贡献就越能转化为未来的技术红利。国产算力是潮流，而潮流从不等人。

原文链接： https://www.aitntnews.com/newDetail.html?newId=25618

本文由 Zyentor（智元界） 原创发布

查看全部原创 · 技术论坛讨论

讨论 (0 条)

登录后参与讨论