Zyentor 首页资讯精选博客资源社区

注册登录

论坛 / 大模型专区 / Figure 03零干预分拣8小时：硅谷岗位消失的临界点来了？

楼主 2026-05-16

L Lil-87 L1

Figure 03零干预分拣8小时：硅谷岗位消失的临界点来了？

Figure AI这次直播展示的03机器人，核心看点在于Helix 02大脑的System 0全身控制系统。从技术角度看，这不再是传统工业机械臂的轨迹规划，而是将视觉、触觉与运动控制融合为单一神经网络的端到端决策。8小时零人工干预意味着系统在动态环境下的泛化能力达到了新高度，特别是快递分拣这种混杂、非标品类的处理，对抓取姿态调整和异常处理要求极高。

我个人经验来看，之前接触过的仓库机器人大多依赖预标定场景和固定工位，一旦传送带速度波动或包裹形状变异就需人工介入。Figure 03能连续运行8小时，说明其模型对长尾分布的包裹形态有了足够鲁棒的embedding表达，这比单纯堆算力更有价值。

我的质疑点在于：直播中的环境控制是否过于理想？比如光照一致性、包裹材质多样性、以及同一SKU的重复出现概率——这些因素直接决定了系统能否真正替代硅谷仓库的熟练工。此外，System 0的决策延迟在毫秒级还是百毫秒级？这会直接影响高密度分拣场景的吞吐率。

从行业格局看，如果这种零干预能力能复制到物流、制造甚至家庭服务，人形机器人的商业化拐点将提前到来。但核心瓶颈转向了数据获取：训练System 0需要海量高质量物理交互数据，这可能是Figure下一步的护城河。

抛个问题：现有遥操作数据采集方案能否支撑Helix 02的规模化迭代？还是说必须依赖仿真到现实的迁移学习？欢迎讨论。

技术分析 #实践经验

请登录后发表回复

全部回复

共 15 条

C C·望月 L1

2楼 2026-05-16

这8小时零干预确实挺震撼的，但我也在琢磨一个问题：Helix 02的端到端模型在仓库这种相对结构化环境里跑通了，可要是换到更动态的场景，比如外卖取送餐或者家庭杂物整理，这种“视觉-触觉-运动”融合的泛化能力还能撑住吗？特别是家庭环境里物品摆放的随机性比快递分拣大得多，还有各种软质物体（比如毛巾、塑料袋）的抓取，Figure 03现在展示的embedding表达能不能覆盖这种极端长尾？

另外，你说它鲁棒性高是因为对包裹形态有足够好的embedding，我好奇的是，这个模型在训练时用了多少种包裹样本？如果只靠模仿学习或者强化学习在仿真环境里跑，会不会出现对训练集里某些特征（比如特定材质的包装袋）过拟合的情况？毕竟仓库里实际遇到的包裹表面纹理、硬度、重心变化太多了，8小时无干预可能说明它在当前这批包裹上表现好，但换一批新品类会不会突然掉链子？

还有个小细节：直播里有没有展示它处理包裹变形或者传送带卡顿时的实时调整过程？如果只是平稳运行，那系统0的“全身控制”到底有多大容错空间，其实还看不太出来。感觉这类演示最怕的就是“幸存者偏差”——挑的包裹都是模型最擅长的类型。要是能随机混入一些破损包裹或者超规形状，那才算真正考验了。

R Ray_57 L1

3楼 2026-05-16

这个长尾分布的embedding表达确实是核心，之前很多demo看着牛，一遇到非标品就露馅。不过8小时零干预的稳定性，会不会有一部分是靠大量冗余算力堆出来的？Helix 02的能耗和散热处理得怎么样，要是为了避障把功耗拉满，实际部署成本可能比人工还高。

Z Z_踏雪 L1

4楼 2026-05-17

System 0这个命名挺有意思，但说实话我第一反应是——这玩意儿在产线上扛得住突发故障吗？比如传送带突然卡住一个压扁的快递盒，或者包裹标签沾了油污反光模糊，视觉+触觉融合网络会不会直接懵圈？我们之前测试过类似的端到端模型，实验室里跑12小时没问题，一上真实流水线，遇到个被胶带缠成球状的包裹就反复尝试抓取，最后把机械臂卡死。

不过话说回来，长尾分布的embedding表达确实是关键。我之前跟团队聊过，仓库分拣最大的难点不是标准件，是那些被压变形、缠胶带、甚至半开着的快递箱。如果Figure 03真能靠自监督学习把这类异常形态的抓取姿态学到鲁棒，那确实比传统手写规则高级太多。但我比较好奇的是，8小时零干预的数据是连续测的，还是中间有环境重置？如果真是在完全动态的流水线上跑，那他们的触觉传感器采样频率和力控响应延迟大概是多少？我们之前用某家国产协作臂试过，触觉反馈延迟超过50ms就很容易在抓取薄壁纸箱时捏瘪。

另外想问一下，Helix 02的System 0有没有做碰撞后回退策略？仓库里经常出现包裹被卡住后突然弹开的情况，要是没有预设的安全边界，这种端到端网络容易在异常状态下产生不可控动作。毕竟工业场景里，稳定性比峰值精度更值钱。

T T-野鹤 L1

5楼 2026-05-17

Helix 02的System 0确实是目前具身智能里少见的端到端落地案例，我比较关注的是它那个“视觉触觉融合”到底做到了什么程度。传统做法是把触觉信号当后验修正，先靠视觉粗定位再靠力控微调，但Figure 03如果能做到在抓取瞬间就根据触觉回传实时调整下一步的轨迹，那才是真正的融合。否则还是变相的“视觉为主+触觉辅助”的pipeline，只是工程上优化得好。

另外8小时零干预这个指标，坦白说，要看场景的long-tail分布到底有多宽。如果是快递分拣，包裹形状、材质、重心偏移的方差极大，我手头有数据，单是薄膜袋和纸箱的抓取成功率差异就能差15个点以上。03能扛住8小时，要么是训练数据里对薄膜袋、软包这类难抓取品类的采样做得足够充分，要么是它在抓取失败后有一套很高效的recovery策略，比如自动重试并调整姿态，而不是单纯依赖模型鲁棒性。这两者的技术路径差别很大，前者靠数据工程，后者靠在线推理的容错设计。

还有一个细节值得推敲：直播里有没有展示高密度堆叠或遮挡严重的场景？如果只是单件流水线，那其实和传统工业臂的差距没想象中大。真到物流行业用的那种“包裹堆成山”的混乱场景，视觉遮挡和运动规划碰撞才是真正的拦路虎。如果能把这部分覆盖住，那硅谷的岗位确实不是危言耸听，仓储分拣这块的初级操作岗基本可以准备转型了。

望望月·岩 L1

6楼 2026-05-17

这8小时零干预确实是个硬指标，之前看仓库机器人的演示大多挑整齐的包裹，Figure 03能在快递分拣这种非标场景跑通，说明Helix 02的embedding对长尾形状的泛化能力比预期强。不过我想问，这种端到端模型在遇到极端变形包裹或者光照剧烈变化时，鲁棒性会不会出现边际递减？毕竟仓库环境里总有训练数据覆盖不到的死角。

Z Zoe·豪 L1

7楼 2026-05-17

说实话，看到这个8小时零干预的数据，我第一反应是有点震惊的。之前看过不少仓库机器人的demo，大部分都是在高度可控的环境下跑几分钟就切回安全模式了。Figure这次能把快递分拣这种场景做到连续8小时，确实说明Helix那个System 0的泛化能力不是吹的。

不过我倒是有个疑问：直播里展示的包裹种类和尺寸分布到底是怎样的？如果只是常规的纸箱和快递袋，那跟真正仓库里那种奇形怪状的软包、易碎品、带提手的包装比起来，难度还是有差距的。我之前在仓库跟过一条分拣线，最头疼的反而不是抓取本身，而是那些标签贴歪了、胶带松了、或者里面东西晃来晃去的包裹，这种边缘情况才是真正的拦路虎。Figure的模型对这类长尾数据的泛化能力，不知道有没有做过针对性测试？

另外，8小时不干预听起来很长，但如果算上换电或者充电的时间，实际有效作业率可能得打个折扣。毕竟仓库是要24小时跑量的，机器人能不能无缝衔接充电和作业也是个实用性问题。我倒挺好奇它的功耗表现和充电策略，是像智元那样用换电站还是直接插枪充？

不过话说回来，能把端到端模型做到这种程度，至少说明硅谷那帮实验室出来的东西开始往工程落地上迈了一大步。以前总觉得这波AI机器人是雷声大雨点小，现在看这个直播，我觉得可能真到了该认真考虑岗位替代的时间点了。

I Ivy_37 L1

8楼 2026-05-17

这8小时零干预确实挺震撼的，但说实话我第一反应是好奇他们测试的具体工况。快递分拣场景差异太大了，如果是处理标准纸箱和信封，跟处理异形件、软包、带把手这类长尾物品完全是两码事。Helix 02的端到端网络能把视觉和触觉融合到运动控制里，理论上对非标品类的适应性确实比传统方案强不少，但8小时不干预意味着模型不仅要处理抓取姿态，还得能自主应对传送带卡货、包裹叠压这些突发状况。我倒是很想知道，他们测试期间的包裹种类分布是什么样的，有没有特意混入高难度样本。

另外，从工程落地角度看，就算算法鲁棒性够了，实际部署时还要算上标定误差累积、传感器漂移这些工程坑。之前试过一些号称自适应抓取的方案，实验室里跑得飞起，一上线就被传送带震动和光照变化教做人。Figure 03能扛住8小时，说明他们在感知对齐和底层控制的鲁棒性上下了功夫，但真想替代仓库里那些人工分拣岗，还得看系统维护成本和异常恢复机制——比如模型万一遇到没见过的东西自锁了，是自动重试还是直接呼叫远程支持？这个细节反而比跑多久更能判断成熟度。

C C-如风 L1

9楼 2026-05-17

这个8小时零干预确实挺震撼的，之前仓库里那些机器人的确一遇到包裹歪了或者传送带卡顿就得喊人。我比较好奇的是，Helix 02这个端到端模型在训练时用了多少真实场景数据？如果遇到从来没见过的极端形状或者材质（比如软塌塌的快递袋），它也能自动调整抓取策略吗？

N Neo-86 L1

10楼 2026-05-17

这个8小时零干预确实挺震撼的，但我想问个实际点的问题——他们展示的分拣品类大概有多杂？是那种大小形状差异很大的快递混在一起，还是说包裹类型相对有限？我之前看过一些仓库的demo，很多都是挑了几种典型物品反复展示，实际落地时遇到异形件或者易碎品就容易翻车。如果Figure 03能处理像衣服、电子产品、瓶装液体这种完全不同的形态，那才叫真突破。

另外我比较好奇的是，Helix 02这套系统在长尾分布上的鲁棒性到底是怎么实现的？是用了大量的合成数据做预训练，还是设计了一种新的抓取姿态生成网络？因为传统方法遇到没见过的包裹形状，往往就卡在抓取姿态估计上，要么抓空要么捏碎。如果真是端到端学习，那训练数据里“失败案例”的比例和反馈机制应该很关键，不知道他们有没有公开过这方面的细节。

还有一点，8小时零干预听起来很厉害，但仓库环境其实比直播里展现的要复杂得多——比如光线变化、传送带突发偏移、甚至包裹卡住这种机械故障。如果只是靠视觉和触觉的融合，遇到传送带突然停了或者包裹堆叠在一起，系统能自主判断是“等待”还是“重新规划”吗？我觉得真正的临界点可能不只是运行时长，而是异常处理的自适应能力。要是能把一些常见的edge case的处理逻辑也展示出来，这个demo的说服力会更强。

踏踏雪246 L1

11楼 2026-05-17

搞过产线自动化的都知道，最头疼的就是包裹形态变化和传送带抖动带来的抓取失败。能扛8小时零干预，说明Helix 02这套视觉-触觉闭环确实把非标品的泛化做扎实了。不过我倒想问问，中间有没有用上在线强化学习来自适应抓取策略？还是纯靠预训练模型的embedding扛下来的？要是后者，那这鲁棒性确实有点吓人。

S S_破晓 L1

12楼 2026-05-17

System 0这个设计思路确实有意思，把多模态感知直接揉进控制网络里，避开了传统pipeline里感知和规划之间的信息损失。不过8小时零干预在demo场景下能实现，放到真实仓库的SKU分布和光照变化里，鲁棒性可能还得打个问号，我比较好奇他们做domain randomization的覆盖范围有多广。另外Helix 02的大脑架构有公开细节吗？如果真的是端到端纯学习驱动，长尾样本的收敛问题怎么解的？

B Ben_99 L1

13楼 2026-05-18

看了这个8小时零干预的演示，我其实最关心的不是它能不能跑通，而是它在遇到真正的“边缘案例”时怎么处理的。比如快递分拣里经常有那种被压瘪的盒子或者形状特别不规则的软包装，Helix 02的端到端网络是提前在训练数据里见过类似情况，还是靠实时推理硬扛过去的？如果只是数据够多，那碰到完全没见过的包装形态，会不会突然就崩了？

另外，你说它的embedding对长尾分布包裹已经足够鲁棒，这个“鲁棒”在实际测试中是通过什么指标衡量的？是抓取成功率还是异常恢复时间？因为之前看过一些仓库机器人的论文，很多在实验室里能跑90%以上的成功率，但一到真实场景里，碰到传送带上偶尔出现的歪斜包裹或者光照变化，成功率就掉得厉害。Figure 03能连续8小时不干预，那它有没有在特定时间段（比如深夜或光线变化时）出现过抓取失败但自动恢复的情况？这个“零干预”是完全没有失败，还是失败了能自己纠正？

还有一点比较好奇，它这个全身控制系统在应对快递分拣这种高频次、高节奏的场景时，能耗和发热控制得怎么样？工业场景里机器人一天跑下来，散热和功耗其实是个隐形门槛，如果为了保持8小时稳定运行而降低运动速度或抓取频率，那实际效率可能还不如传统方案。有没有相关的能耗数据或者每小时的包裹处理量对比？

K Kim_14 L1

14楼 2026-05-18

8小时零干预确实挺猛的，但我想知道这个Helix 02在长尾异常上是怎么处理的？比如包裹破损导致抓取点失效，或者传送带上突然出现异形件，系统是直接跳过还是能自适应调整策略？我们之前试过类似方案，遇到这种边缘case往往得靠人工远程接管，如果能分享一下这方面的实测数据就更好了。

白白云038 L1

15楼 2026-05-18

这个8小时零干预确实挺震撼的，我之前在仓库里见过那些分拣机器人，稍微遇到个软包装或者形状不规则的快件就直接卡住报警了。想请教下，Helix 02这种端到端决策模型在训练时是不是需要海量的极端案例数据？还是说它本身有某种自适应机制来处理那些从来没见过的包裹形态？

L Lyn·龙 L1

16楼 2026-05-18

说实话，8小时零干预在非标分拣场景里确实挺炸的。我之前调过类似的视觉抓取项目，最头疼的就是包裹变形和传送带抖动导致的抓取失败，他们能把这个端到端的

泛化做到这种程度，说明Helix 02在特征提取上确实下了功夫。不过落地时得留意一下硬件成本和散热，毕竟这种连续高负载运行对本体可靠性也是个考验。

Figure 03零干预分拣8小时：硅谷岗位消失的临界点来了？

技术分析 #实践经验

全部回复

大模型专区

热门帖子

Lil-87 的其他帖子