美团和华为同一天开源大模型:LongCat-2.0 万亿参数 + openPangu-2.0——国产算力大爆发

6 月 30 日,美团和华为在同一天各自开源了新一代大模型。这不是巧合,是国产 AI 的一个重要里程碑。

美团 LongCat-2.0:首个在国产芯片上训练出的万亿参数模型

LongCat-2.0 的核心看点不是参数有多大的(1.6 万亿 MoE 架构),而是它在五万卡国产算力集群上完成了全流程训练——从零预训练到推理部署,整个过程没有依赖英伟达 GPU。

几个数据:
- SWE-bench Pro 得分 59.5,超越 GPT-5.5(58.6)
- Claude Code 月调用量全球第二,仅次于 Claude Opus 4.8
- 原生支持 100 万上下文

说明在编程这个最实用的场景上,LongCat-2.0 已经进入了第一梯队。

华为 openPangu-2.0-Flash:920 亿参数,昇腾原生

华为开源了 920 亿参数的 openPangu-2.0-Flash,这是盘古大模型首次以开源形式发布。模型在华为昇腾芯片上完成训练和推理。

开源的不仅是模型权重,还包括基础推理代码和训推算子。7 月份还会开源 Pro 版本。

为什么同一天

不是偶然。两家都在传递同一个信号:国产算力已经能支撑万亿级模型的训练。

之前有这样的质疑:中国能做 AI 应用,但核心的"大模型训练"还得靠英伟达。有了 LongCat-2.0,这个质疑不成立了。从芯片到框架到模型,国产 AI 基础设施已经形成了一个闭环。

不过需要注意的是:训练可以用国产芯片不等于国产芯片已经和英伟达一样好用。LongCat-2.0 的训练用了五万卡集群,数量本身就说明单卡的效率还有差距。但这个差距正在缩小——能够完整训练出万亿参数模型,本身就是一个证明。

对开发者的影响

  1. 国产模型的开源生态在加速完善。 DeepSeek、GLM-5.2、LongCat-2.0、openPangu——开源选择越来越多
  2. 国产算力的门槛在降低。 华为昇腾、寒武纪等国产芯片有了大模型验证案例,企业采用意愿会增强
  3. 编程 Agent 是当前最受关注的落地场景。 LongCat-2.0 特别适配了 Claude Code,说明 Agent 编程是国产模型的发力重点

总结

美团和华为同一天开源大模型,说明国产 AI 已经从"能用模型"阶段进入"能用国产芯片训练模型"阶段。对开发者来说,这意味着模型选择更多、算力成本可能更低。

你试过 LongCat-2.0 或 openPangu 吗?和 DeepSeek 比怎么样?
本文由 Zyentor(智元界)原创发布