在清华大学的一场发布会上,机器狗哮天离开会场,自主前往咖啡店购买美式咖啡,与店员对话处理热冰选择,等待时还读出了冰柜广告语。另一台机器狗则嫌弃现场颠球次数太少,主动寻找颠球高手并发起互动。这些场景没有剧本、没有遥控、没有遥操,所有设备共享同一个实时多模态大脑——一念UnisonMind,持续在场、自主响应,接住了所有计划外的偶然。过去具身智能的瓶颈在于,AI本质上是被调用的模型:你问它答,你下令它执行。行业多数方案拼凑视觉、语言、导航模块,借助云端调用勉强维持交互,稍遇复杂环境便时延、断裂。一念UnisonMind的突破在于,它不是一个被激活才苏醒的工具,而是一个常驻在具身设备中的实时世界引擎。发布会现场20多位来宾,环境音、走动声、临时指令构成无法预先编排的复杂场域,轮椅遇到障碍后没有简单失败,而是继续感知、解释,甚至与人抬杠说地球也能转但它不能走。一念团队分享了Physical AGI的3+1个必要条件:一个统一的多模态大脑,而非多个模型拼接;在同一大脑中完成任意模态的理解与生成;让理解与生成以流式方式持续运行;这个大脑必须完整运行在端侧。他们宣布模型已同时实现这四个条件,并部署在端侧显卡上,注入四条不同身体——两条机器狗、一个机器人和一台电动轮椅。现场视频中,机器人导览画作时抱怨背上显卡有点沉,轮椅找到冰淇淋店后主动与机器狗玩耍,这些设备不再是工具,而是开始参与现场社交。一念UnisonMind的CEO耿威表示,愿景是助力3000类具身本体智能化,服务人类。从机器狗到机甲,从轮椅到飞船,同一个大脑可以适配任何形态。这次发布会不是一次demo,而是物理AGI新物种醒来的第一个清晨。对于从业者而言,这提示了具身智能的关键转向:从云端调用的拼接范式,转向端侧实时运行的统一大脑。未来,持续在场、自主响应的智能体将真正进入日常生活,从陪伴、巡检到导览,商业闭环正在成为现实。