当生成式AI视频还在让你等待几十秒才能看到一段固定剪辑时,一场更深层的变革已经悄然展开。Reactor,这家由前Apple Vision Pro两位技术负责人联合创办的公司,近期完成了5900万美元的种子轮及A轮融资,由光速创投领投。它的目标不是生产世界模型,而是成为实时AI世界的底层基础设施——一个让开发者能够像调用AWS API一样,轻松构建实时交互式AI世界的平台。

Reactor的CEO Alberto Taiuti和CTO Bryce Schmidtchen均来自Apple Vision Pro核心技术团队。Taiuti此前还是Luma AI的联合创始人兼CTO,曾搭建全球使用最广泛的3D和视频生成平台的基础设施。在他们的带领下,Reactor已吸引了来自Apple、Netflix、Meta、Google、Adobe、Replicate、Microsoft等公司的工程师与研究人员。Reactor的定位非常清晰:它不生产世界模型,而是为世界模型提供运行和开发的底层基础设施。其平台提供统一的SDK与API,让开发者无需自行管理复杂的底层服务器架构,仅需少量代码即可构建实时交互式应用并实现规模化运行。在技术指标上,Reactor已将端到端延迟控制在50毫秒以内,为实时交互奠定了技术基础。

传统生成式AI视频工具的运行逻辑相对固定:用户输入提示词后,系统需要等待数十秒甚至几分钟,最终输出一段预渲染的静态视频。无论是OpenAI的Sora、Runway还是Pika,它们生成的本质上都是一次性的、不可交互的剪辑片段。而世界模型代表了一种更深层次的转变:AI不再是生产内容的工厂,而是逐步演变为能够理解物理规律、实时响应外界交互的动态系统。Taiuti对此描述道:“世界模型正在重新定义AI的能力边界,从孤立生成内容的系统,变成能够实时感知并回应的系统。我们正在构建连接实验室模型与开发者之间的关键桥梁。”

实时生成式视频的最大挑战不在生成本身,而在响应速度。对于实时AI交互而言,延迟直接决定了体验的优劣。AWS已确认为Reactor的首选云合作伙伴,提供能够支撑全球规模实时交互的算力底座。从公开演示来看,用户通过网页浏览器即可直接体验AI实时生成的3D环境,例如一辆跑车在AI实时渲染的外星沙漠中行驶,地形与天体画面流畅地跟随玩家操作。过去需要成百上千人日才能完成的开发任务,现在只需一套统一接口即可实现。随着具身智能与实时生成式视频技术的演进,Reactor的出现不仅解决了高保真动态环境的实时生成难题,也预示着实时AI交互新纪元的到来。对于开发者而言,现在正是关注并尝试这类基础设施平台的最佳时机。