中科院团队的MRAM存内概率计算方案拿到数千万融资,确实让人眼前一亮。从技术角度看,他们提出的“器件+算法+架构”全栈方案直击了传统冯·诺依曼架构的存储墙瓶颈。MRAM本身具有非易失性和高能效特性,而概率计算则利用了器件的随机性来加速生成式AI中的采样和贝叶斯推断任务,这在理论上是合理的。关键数据是“万倍能效提升”,但这里必须谨慎:这种提升通常是在特定任务(如概率推理)下对比传统GPU或数字ASIC得出的理想值,实际部署时可能受限于器件一致性、温度漂移和外围电路开销。

从我个人的嵌入式AI部署经验来看,存内计算(IMC)在边缘端的落地经常卡在精度和良率上。MRAM的写能耗虽然低,但读写寿命和工艺偏差在概率计算场景下反而可能成为优势——因为随机性正是计算所需。不过,团队计划2027年交付芯片,时间表很紧,尤其是自动驾驶决策优化这类高可靠性场景,概率计算的不可重复性可能给功能安全验证带来新挑战。

这里有两个问题值得讨论:1)MRAM的概率计算如何解决器件热噪声与算法随机性的解耦问题?2)在边缘具身智能场景中,万倍能效提升是否包含感知-规划-控制全链路的能耗,还是仅针对决策优化子模块?

行业视野上,这条路线可能改变AI芯片的竞争格局,尤其是针对低功耗边缘端。如果MRAM概率计算能成熟,传统GPU和NPU的统治地位会受冲击,但前提是团队能解决生态兼容性——毕竟英伟达的CUDA生态不是一朝一夕能替代的。