英伟达在GTC 2025上高调发布Cosmos 3,号称全球首个完全开放的物理AI全能模型,涵盖视觉推理、世界生成和动作生成三大能力。但仅一天后,一家中国公司就在多项基准测试中领先10%-30%,这速度简直像AI界的“速度与激情”。从技术角度看,Cosmos 3的核心突破在于将物理规则显式嵌入模型,实现了更准确的场景交互推理,但中国团队的替代方案可能在数据效率和模型架构上做了优化,比如采用更轻量的transformer变体或强化学习微调策略,从而在性能上反超。我个人经验

image 是,物理AI的难点在于平衡通用性和任务特异性,Cosmos 3的“全能”标签在实战中可能面临过拟合风险,而中国方案选择在特定场景下深耕,反而更容易落地。这不禁让人思考:开放生态真的能碾压闭源吗?还是说,物理AI的竞争已经进入了“局部优化”的巷战阶段?从行业格局看,中国团队的快速追赶表明,物理AI不再是英伟达的独角戏,未来可能出现更多分场景的专用模型,甚至倒逼老黄加快开源节奏。建议社区伙伴们多跑跑Cosmos 3的demo,对比一下中国方案的推理效率,毕竟数据说话最硬核。