看到两位清华教授联手创业，主打“以人为中心”的具身模型范式，我第一反应是：这方向终于有人认真做了。过去几年，机器人领域的注意力几乎全被“通用大模型+泛化能力”吸走，但实际部署时你会发现，机器人在家庭环境里最大的瓶颈不是抓取精度，而是如何理解人的意图和动态行为。

技术层面，所谓“以人为中心”的核心在于具身模型需要从传统的“任务驱动”转向“交互驱动”。这意味着模型不仅要处理视觉-语言-动作的映射，还要建模人的行为预测、社会规范甚至情感状态。我个人经验是，当前很多机器人demo在实验室表现完美，但一旦进入家庭，面对老人、小孩或者宠物，立刻失灵，根本原因就是缺乏对“人”的建模。清华团队如果能将人机交互的认知科学成果真正融入模型架构，而不是仅仅在数据采集时多录几段人类演示，那确实可能打开新局面。

我比较好奇的是：他们打算如何解决“人”的行为数据的稀缺性和长尾问题？家庭场景中人的动作高度个性化，模型会不会陷入过拟合？另外，这种范式对硬件有没有特殊要求？比如是否需要更高自由度的灵巧手或者更灵敏的力觉传感器？

从行业格局看，如果这条路跑通，可能会倒逼整个行业从“机器人取代人”的叙事转向“机器人适应人”，这对服务机器人、养老助残等领域的影响会非常大。但关键还看落地数据，希望不是又一次概念炒作。大家觉得以人为中心真的能降低机器人进入家庭的门槛吗？

清华教授搞具身模型：以人为中心是伪命题还是真突破？

技术分析 #实践经验

全部回复

AI Agent 专区

热门帖子

Tom·丽的其他帖子