{
title: "北大发布自进化5D世界模型,场景万物可控",
summary: "北京大学EvoPhys团队推出全球首个以人为中心的5D世界模型EvoPhys-World,基于摩尔线程全国产算力底座,实现场景级万物可控。该模型突破传统AI生成世界的局限,从可观看、可漫游的浅交互阶段,进入可操纵、深交互、自进化的新阶段。关键性能包括支持多模态交互、动态场景调整和持续学习能力,为虚拟现实、数字孪生和智能仿真等领域提供全新解决方案。",
content: "在AI生成内容领域,我们终于迎来了一个里程碑式的突破。北京大学EvoPhys团队正式发布全球首个以人为中心的5D世界模型EvoPhys-World,它基于摩尔线程全国产算力底座,将AI生成世界从可观看、可漫游的浅交互阶段,推进到可操纵、深交互、自进化的全新阶段。这意味着,未来的虚拟世界不再是静态的布景,而是能够根据人的意图实时演化的动态空间。
EvoPhys-World的核心创新在于其5D架构。传统3D模型只能描述静态几何,而该模型引入了时间维度和交互维度,形成包含空间、时间、交互、物理属性和语义标签的5D表示。具体来说,模型支持场景级万物可控,用户可以通过自然语言或手势指令,对场景中的任何物体进行位置、姿态、材质和物理属性的实时调整。例如,在虚拟实验室中,用户可以直接拖动烧杯、调整液体颜色,甚至改变重力参数,所有变化都会遵循物理规律实时呈现。
技术实现上,EvoPhys-World采用了自进化学习机制。模型不仅能够根据用户交互生成合理反馈,还能通过持续的数据积累自动优化生成策略。据团队公布的数据,该模型在场景生成速度上达到每秒30帧以上,交互延迟低于50毫秒,支持同时处理超过1000个交互对象的复杂场景。更重要的是,它基于摩尔线程的国产GPU集群训练,摆脱了对进口硬件的依赖,在能效比上比同类国际方案提升了约40%。
这一突破对多个行业具有深远影响。在游戏领域,开发者可以快速生成高度互动的开放世界,玩家行为将真正改变游戏环境;在工业仿真中,工程师能够实时调整生产线参数,模拟不同工况下的设备响应;在数字孪生城市里,规划者可以直观地测试交通流量、建筑布局和应急方案。目前,该模型已在智慧城市、虚拟教学和影视制作等场景完成初步验证,平均场景构建时间从数天缩短至数小时。
展望未来,EvoPhys-World的进化潜力令人期待。随着算力基础设施的持续升级和更多行业数据的接入,模型有望实现从场景级交互向城市级、甚至全球级虚拟世界的跨越。对于AI从业者而言,这不仅是技术路线的示范,更是一个明确的信号:以人为中心的交互式世界模型将成为下一代AI应用的核心方向。建议关注模型的开源进展和API接口开放计划,以便尽早将其能力融入自身产品。"
}