AI行业最稀缺的资源正在发生根本性转变。当李飞飞提出“空间智能”概念后,行业共识逐渐清晰:大模型之后,世界模型和具身智能成为资本与产业的新焦点。然而,一个尴尬的现实随之浮现——训练这些模型所需的真实物理世界交互数据极度稀缺,业内观点甚至认为,需求与供给之间可能存在近十万倍的差距。过去的大模型依靠海量文本和图片就能完成语言理解,但具身智能需要的是“决策→行动→反馈”的完整链条,静态数据已难以满足需求。高质量的物理世界数据,正成为战略级的稀缺资源。

令人意外的是,AI时代最大的物理世界数据入口之一,可能正从一个意想不到的行业诞生——出行平台。广汽集团旗下的如祺出行率先披露了具体数据:2025年,以AI数据服务为主要收入来源的技术服务板块录得营收1.6亿元,同比大增487.4%。这一增速表明,市场对高质量物理世界数据的需求正在快速释放。如祺数据最早布局于2023年,当时获批乙级测绘资质,将搭载激光雷达、高精度惯导等传感器的智能驾驶数据采集车投入常态化运营。这些车辆在提供出行服务的同时,合规采集真实的驾驶和道路数据。

截至2026年5月,如祺数据已在广州、上海、重庆、沈阳等城市部署超过300辆采集车,日均产出达1600小时、130TB,累计沉淀千万级高价值驾驶场景片段。其数据资产覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类,涵盖从原始采集到加工交付的全链条。客户结构也验证了其跨行业能力:腾讯、小马智行、理想、火山引擎、百度智能云、广汽集团等头部企业均是其客户。这意味着,从出行服务衍生出的数据服务,已具备跨行业解决实际需求的能力,并能跑通从采集、加工到商业化交付的完整闭环。

出行平台之所以能成为AI基础设施,源于两个本质问题:为何AI行业对物理世界数据如此渴求?为何出行平台能填补这个缺口?李飞飞认为,当前大语言模型缺乏“空间智能”——对三维物理世界进行感知、推理和行动的能力。世界模型需要生成性、多模态性和交互性,而出行平台每天产生的海量驾驶数据,恰好提供了带有因果逻辑、持续产出的真实交互数据。如祺出行从出行服务商向“数据集+全栈能力”综合服务商的转型,很可能成为下一代AI不可或缺的底层基础设施之一。对于AI从业者而言,关注出行平台的数据资产化进程,或许能提前把握住下一个技术风口。