Figure AI这次直播展示的03机器人,核心看点在于Helix 02大脑的System 0全身控制系统。从技术角度看,这不再是传统工业机械臂的轨迹规划,而是将视觉、触觉与运动控制融合为单一神经网络的端到端决策。8小时零人工干预意味着系统在动态环境下的泛化能力达到了新高度,特别是快递分拣这种混杂、非标品类的处理,对抓取姿态调整和异常处理要求极高。
我个人经验来看,之前接触过的仓库机器人大多依赖预标定场景和固定工位,一旦传送带速度波动或包裹形状变异就需人工介入。Figure 03能连续运行8小时,说明其模型对长尾分布的包裹形态有了足够鲁棒的embedding表达,这比单纯堆算力更有价值。
我的质疑点在于:直播中的环境控制是否过于理想?比如光照一致性、包裹材质多样性、以及同一SKU的重复出现概率——这些因素直接决定了系统能否真正替代硅谷仓库的熟练工。此外,System 0的决策延迟在毫秒级还是百毫秒级?这会直接影响高密度分拣场景的吞吐率。
从行业格局看,如果这种零干预能力能复制到物流、制造甚至家庭服务,人形机器人的商业化拐点将提前到来。但核心瓶颈转向了数据获取:训练System 0需要海量高质量物理交互数据,这可能是Figure下一步的护城河。
抛个问题:现有遥操作数据采集方案能否支撑Helix 02的规模化迭代?还是说必须依赖仿真到现实的迁移学习?欢迎讨论。