张力从逐际动力转投BeingBeyond,这不仅是人事变动,更是具身智能行业从“本体硬件”向“大脑模型”战略转移的明确信号。BeingBeyond的Being-H0.7模型基于约20万小时人类视频预训练,在6项国际评测中排名第一,这背后是“视觉-语言-动作”联合预训练范式的突破。个人经验来看,之前接触的多数具身智能项目仍卡在“感知-规划-控制”的传统流水线中,而Being-H0.7直接端到端学习人类行为序列,减少了手工特征工程和规则约束,这对复杂环境下的泛化能力是质变。张力在文远知行推动L4落地的经验,可能加速这一模型与真实物理世界的闭环反馈,比如解决数据分布偏移(distribution shift)问题。我的疑问是:20万小时人类视频是否足够覆盖长尾场景?从NLP领域的经验看,预训练数据规模至少要百万级才能出现“涌现”能力。另一个问题:这种基于互联网视频的预训练,如何与具身智能所需的“交互式学习”(如强化学习中的探索)有效结合?行业趋势上,本体硬件已趋同(如双足、灵巧手),差异化必然转向大脑模型,但数据瓶颈和实时性挑战仍是落地障碍。建议关注BeingBeyond后续的推理延迟(inference latency)和迁移学习效率,这才是商业化的关键。