清华团队一念UnisonMind：机器狗买咖啡，物理AGI现场首秀

在清华大学的一场发布会上，机器狗哮天离开会场，自主前往咖啡店购买美式咖啡，与店员对话处理热冰选择，等待时还读出了冰柜广告语。另一台机器狗则嫌弃现场颠球次数太少，主动寻找颠球高手并发起互动。这些场景没有剧本、没有遥控、没有遥操，所有设备共享同一个实时多模态大脑——一念UnisonMind，持续在场、自主响应，接住了所有计划外的偶然。过去具身智能的瓶颈在于，AI本质上是被调用的模型：你问它答，你下令它执行。行业多数方案拼凑视觉、语言、导航模块，借助云端调用勉强维持交互，稍遇复杂环境便时延、断裂。一念UnisonMind的突破在于，它不是一个被激活才苏醒的工具，而是一个常驻在具身设备中的实时世界引擎。发布会现场20多位来宾，环境音、走动声、临时指令构成无法预先编排的复杂场域，轮椅遇到障碍后没有简单失败，而是继续感知、解释，甚至与人抬杠说地球也能转但它不能走。一念团队分享了Physical AGI的3+1个必要条件：一个统一的多模态大脑，而非多个模型拼接；在同一大脑中完成任意模态的理解与生成；让理解与生成以流式方式持续运行；这个大脑必须完整运行在端侧。他们宣布模型已同时实现这四个条件，并部署在端侧显卡上，注入四条不同身体——两条机器狗、一个机器人和一台电动轮椅。现场视频中，机器人导览画作时抱怨背上显卡有点沉，轮椅找到冰淇淋店后主动与机器狗玩耍，这些设备不再是工具，而是开始参与现场社交。一念UnisonMind的CEO耿威表示，愿景是助力3000类具身本体智能化，服务人类。从机器狗到机甲，从轮椅到飞船，同一个大脑可以适配任何形态。这次发布会不是一次demo，而是物理AGI新物种醒来的第一个清晨。对于从业者而言，这提示了具身智能的关键转向：从云端调用的拼接范式，转向端侧实时运行的统一大脑。未来，持续在场、自主响应的智能体将真正进入日常生活，从陪伴、巡检到导览，商业闭环正在成为现实。

清华团队一念UnisonMind：机器狗买咖啡，物理AGI现场首秀

相关推荐

2026 AI 开发者生存指南（10）：AI 开发者职业发展与学习路线图——从入门到精通

Sand.ai获超亿美元融资，曹越押注视频通往世界模型

华尔街量化巨头押注Anthropic爆赚50倍

Sand.ai获超亿美元融资，曹越押注视频通往世界模型

华尔街量化巨头押注Anthropic爆赚50倍

📖 更多原创