全球超算格局迎来历史性转折。由中山大学教授卢宇彤带队、深圳制造的灵晟超算,近日以超过2EFlops的双精度浮点性能登顶全球TOP500榜单,打破了西方近十年的垄断地位。更令人震惊的是,这台世界第一的超算竟然没有使用一块GPU,甚至不含任何英伟达技术,堪称异类。图灵奖得主Jack Dongarra在现场评价,灵晟是AI4S新型架构的希望之光,将重新划定全球算力竞争格局。

灵晟的核心在于其全自主可控的纯CPU架构。其自研的LX2芯片基于Armv9指令集,每颗集成304个核心,主频1.55GHz,整机部署约1379万核。LX2并非传统CPU,内部集成了AI矩阵加速单元,原生支持FP64、FP32、BF16、FP16、INT8多种精度格式,将矩阵加速能力直接内嵌进CPU。官方表示,在混合精度与稀疏/稠密矩阵计算等关键指标上,灵晟已超越传统CPU+GPU异构架构。内存方面,灵晟是全球首款集成国产HBM的超算系统,每颗LX2搭载32GB国产HBM,带宽达4TB/s,同时搭配最高256GB外部DDR5内存,相比传统CPU带宽提升10倍。网络层面,自研灵启高速互连网络支持200万个端口、10万节点组网,节点间带宽达1.6Tb/s。散热采用100%全液冷机柜,整机功耗42.2MW,能效比52.07GFlops/W,在Green500能效榜排名第50位。

灵晟的夺冠意味着时隔九年,中国超算重返TOP500榜首,上一次是2017年的神威太湖之光。它打破了E级算力必须依赖GPU的行业惯例——当前TOP500前列的El Capitan、Frontier、Aurora等超算无一例外都以GPU为核心。据英伟达官方披露,本届ISC2026发布的TOP500榜单中,英伟达技术支撑的系统超过400台,占总数81%。灵晟的出现,证明全CPU路线在传统科学计算场景下的可行性,同时其内嵌AI矩阵加速单元的设计,天然适合承载HPC与AI融合计算。在HPCG榜单上,灵晟同步以22 PFLOPS登顶,进一步印证了综合实力。总设计师卢宇彤曾以天河二号副总设计师身份六次夺冠,时隔十一年再度领奖,灵晟接续了历史。

展望未来,灵晟的实际应用已在多个科学领域展开,AI for Science正成为超算最受关注的前沿方向。对于AI从业者和爱好者而言,灵晟的启示在于:算力架构的多元化正在打破GPU的绝对统治,自研芯片和全栈优化在特定场景下能实现超越。建议关注国产算力生态的演进,尤其是CPU内嵌AI加速单元的设计思路,可能为边缘计算和大规模科学计算提供新路径。灵晟不仅是性能的胜利,更是自主可控路线的里程碑,它将推动全球超算竞争进入新的维度。