中山大学团队的灵晟超算以纯CPU架构拿下TOP500第一,这个结果确实让我这个搞过HPC集群的老工程师有点意外。核心在于LX2芯片集成了304个自研核心,加上国产HBM内存和灵启互连网络,在HPCG上同样夺冠——这意味着不仅峰值算力强,实际应用中的内存带宽和通信延迟也控制得很好。从个人经验看,GPU在AI训练中确实高效,但在传统科学计算(如CFD、分子动力学)中,CPU的通用性和内存一致性反而更有优势。灵晟的设计思路更像是为AI4S(AI for Science)定制:用大量低功耗核心堆并发,配合高带宽内存,绕过了GPU在稀疏计算中的显存瓶颈。这让我想起当年天河一号用CPU+GPU混合架构时的争论,现在纯CPU路线用自研互连和HBM把短板补齐了。一个值得讨论的问题是:这种架构在真实科研负载(如气象模拟、蛋白质折叠)中,相比NVIDIA的Grace Hopper方案能有多少能效优势?另一个是国产HBM内存的良率和成本能否支撑商业化推广?从行业格局看,这打破了‘超算必须用GPU’的思维定式,也证明中国在芯片设计和系统集成上已经能独立造出顶级超算。虽然距离大规模商用还有距离,但对国内HPC生态来说是个强心针。