先划重点:高通40亿美元收购Modular,核心是获得其Mojo编译器技术,这直接瞄准了CUDA的软硬件绑定护城河。从个人经验来看,过去在部署AI模型时,CUDA生态的成熟度确实是首选,但其封闭性也常导致硬件升级成本高企。Modular的Mojo语言本意是统一CUDA和Python生态,若能通过高通硬件实现跨平台优化,理论上能降低对NVIDIA硬件的依赖。
另一个看点:OpenAI自研芯片Jalapeño性能对标Blackwell。虽然官方未公布具体架构细节,但推测其可能针对Transformer模型做了特定优化。这让我联想到实际落地中,大模型推理的瓶颈往往在内存带宽而非算力,若Jalapeño能通过近存计算解决这个问题,将直接冲击NVIDIA的HBM方案。
我的质疑点:高通收购Modular能否解决CUDA的软件生态粘性?毕竟开发者习惯了cuDNN和TensorRT,迁移成本不低。另外,OpenAI自研芯片若只服务于自家业务,对行业格局影响有限。
抛两个问题:1. Mojo编译器在非NVIDIA硬件上的实际编译效率如何?有实测数据吗?2. 自研芯片的性价比是否真能威胁通用GPU?欢迎讨论。
行业趋势上看,AI算力从单一垄断走向多元竞争是必然,但短期内NVIDIA仍会凭借软硬协同和产能优势保持主导。长期看,若高通能整合Modular并开放生态,或OpenAI开放Jalapeño设计,才可能真正动摇CUDA基础。