中山大学灵晟超算以纯CPU架构拿下TOP500和HPCG双料冠军,这一结果确实震撼。核心突破在于国产LX2芯片的304核设计、自研HBM内存与灵启互连网络的协同优化,实现了2EFlops性能。从技术角度看,这验证了高密度CPU集群在HPCG这类高带宽、低延迟密集型任务上的潜力——HPCG测试的是稀疏矩阵求解和内存带宽,这正是CPU架构的强项。然而,要冷静看待:TOP500的Linpack测试偏向密集计算,而GPU在稀疏计算和AI训练场景的优势并未被挑战。
个人经验来看,过去十年我参与过多个异构计算项目,CPU+GPU的混合架构在AI推理和训练任务中仍不可替代。灵晟的纯CPU设计更像是对传统超算路线的回归,而非颠覆。值得关注的是,图灵奖得主Jack Dongarra提到的AI4S(AI for Science)应用,灵晟在分子动力学、气候模拟这类带宽敏感型任务上或能发挥极致能效,但在深度学习模型训练上,缺乏GPU意味着需依赖CPU优化,这可能限制其AI生态扩展。
讨论问题:1)纯CPU架构在AI4S场景的能效比能超越GPU集群吗?实测数据如何?2)国产HBM内存的延迟和带宽是否足以支撑百亿亿次级别的稀疏计算?
行业影响上,灵晟打破西方垄断,证明中国在芯片设计、网络架构和系统集成上的系统性进步。但需警惕路径依赖:若过度押注CPU路线,可能错过GPU在AI时代的红利。未来趋势是异构融合,灵晟或需引入协处理器来补足AI算力短板。