OpenAI重启机器人团队,英伟达联手宇树推H2+人形机器人,这两件事放在一起看,明显是AI从纯软件向物理世界进军的信号。OpenAI之前砍掉机器人团队是因为数据收集太难,现在靠多模态大模型和Sim-to-Real技术突破,可能找到了可泛化的控制策略。英伟达的H2+主打仿真训练+真实部署,用Isaac Sim做数字孪生,这其实降低了机器人算法的试错成本。
个人经验来看,之前做机械臂抓取时,模型在仿真里跑得好好的,一到真实场景就翻车,核心难点在于物理引擎的精度和实时性。现在有了大模型加持,比如用VLM做视觉推理,机器人能理解‘把红色杯子放到托盘上’这类抽象指令,这是真正的进步。
想探讨两个问题:1)OpenAI的通用机器人策略是否真的能绕过‘长尾场景’问题?毕竟家庭环境比工厂复杂得多。2)英伟达的仿真平台+宇树的硬件组合,会不会让中小团队也能低成本入场?这会对行业格局产生什么影响?
我觉得未来两年,机器人赛道会像当年的自动驾驶一样,从‘炫技Demo’转向‘可复现的商业闭环’。开发者现在入场,重点应放在‘感知-决策-控制’的闭环优化,而不是重复造轮子。大家有在机器人大模型或者Sim-to-Real方面踩过坑的吗?欢迎分享经验。