英伟达股东大会今天召开,Vera Rubin 专门为 AI Agent 打造,Blackwell 产能还在爬坡
6 月 24 日,英伟达召开 2026 年度股东大会。核心议题只有一个:下一代芯片 Vera Rubin 能不能按时交付。
Vera Rubin 为什么重要
黄仁勋在 6 月初的 COMPUTEX 上说得很直白:"Vera Rubin 不只是一个 AI 芯片,是专门为 AI Agent 设计的计算平台。"
这不是营销话术。Vera Rubin 的架构设计反映了 Agent 的特殊计算需求:
传统 AI 推理:一次调用,算完结束
Agent 推理:多步调用,需要记忆、需要规划、需要调用工具
Vera Rubin 为此做的是:
├─ 更大的 HBM 带宽(Agent 的多步推理需要更快的记忆访问)
├─ 更强的 CPU(Vera 是英伟达自研数据中心 CPU,黄仁勋说它会比 GPU 更受欢迎)
└─ 更高效的多任务调度(Agent 通常并发调用多个工具)
供应链的核心矛盾
当前最大的问题不是需求,是供应。Blackwell 系列仍然供不应求,英伟达虽然占了台积电近 60% 的先进封装产能,还是不够。三星、SK 海力士、美光的 LPDRAM 产能只能满足 Vera Rubin 约 60% 的需求。
这意味着两件事:
1. AI GPU 的紧缺状态会持续至少到 2027 年
2. 国产算力的替代窗口仍然存在
推理收入占比是关键指标
英伟达数据中心约 40% 营收来自 AI 推理、60% 来自训练。推理占比如果持续上升,说明 AI 已经不是"烧钱训练"阶段,而是进入了"商业应用"阶段。
这个数字对 AI 行业来说比 Blackwell 的出货量更重要——它决定了 AI 是不是一个能自己赚钱的赛道。
对开发者的影响
Vera Rubin 专为 Agent 设计这件事,说明了一个趋势:AI Agent 正在从软件走向硬件层面的优化。未来 Agent 的性能提升不只看模型能力,还看底层芯片的适配。
短期来说,开发 Agent 应用还是用云端 API 最方便。但长期来看,如果 Vera Rubin 确实能把 Agent 的推理成本降 50-80%,Agent 的普及速度会大大加快。
总结
英伟达股东大会的核心信号:AI 的硬件军备竞赛没有减速,而且方向正在从"通用 AI"转向"专用 Agent"。对于开发者来说,持续关注 Agent 的底层基础设施变化是值得的。
你觉得 Agent 会成为 AI 芯片的下一个主战场吗?
本文由 Zyentor(智元界)原创发布