一颗细胞,正在改写AI与生命科学的交汇点。近日,百曜科技正式发布全球首个基于LLM-JEPA架构的AI虚拟细胞世界模型AURA CellOS,这是目前公开报道中参数规模最大的单细胞基础模型。基于3.905亿个人类单细胞转录组数据训练,它覆盖了40余种人体组织和260余种细胞类型,几乎囊括所有重要的人类细胞类型。最引人注目的是,CellOS首次将联合嵌入预测架构(JEPA)与世界模型理念系统性引入单细胞研究,这一技术路线在自动驾驶、机器人等领域已验证其价值,如今正试图攻克生命科学中最复杂的系统——细胞。
理解细胞变化是生命科学的核心命题。疾病发生、药物作用、细胞治疗,本质上都是细胞状态的变化过程。传统方法依赖细胞培养、动物实验和人体验证,研发成本高昂且周期漫长,“十年研发周期、十亿美元投入,临床成功率不足10%”的“双十定律”长期困扰行业。AI虚拟细胞的出现为破解这一困局提供了新路径。此前,Geneformer、scGPT、scFoundation等模型已解决了细胞类型识别等基础需求,但在预测细胞动态变化上存在明显局限——例如在敲除基因、给药或诱导分化后,细胞如何演化?这些模型难以区分背景噪声与真正驱动细胞状态演化的关键信号。2026年《Nature Methods》的一项研究更揭示:基于2220万个细胞的预训练,模型性能在使用约1%的数据后便进入平台期,表明单纯扩大数据规模已无法显著提升预测能力。
CellOS给出的答案是:传统语言模型架构与细胞数据特性存在系统性错配。模型需要学习细胞状态演化规律,而非静态表达模式。CellOS的“三板斧”直击痛点:第一,采用JEPA架构,在抽象表示空间进行联合嵌入预测,而非直接预测原始数据,这使其能捕捉细胞变化的因果机制;第二,引入世界模型理念,让模型学会模拟细胞在不同扰动条件下的演化轨迹;第三,通过大规模多组织多细胞类型训练,使模型具备跨场景迁移能力。在公开评测中,CellOS在预测精度、扰动建模等核心指标上与多款主流模型拉开倍数差距,达到当前国际领先水平。
从技术突破到产业落地,CellOS打开了AI虚拟细胞商业化的想象空间。对于新药研发,它有望大幅缩短靶点发现和候选药物筛选周期,降低临床前试错成本;对于细胞治疗,它可预测基因编辑后的细胞行为,提升治疗安全性和有效性。当然,从实验室到临床仍有很长的路要走,模型在真实复杂生物环境中的泛化能力、与湿实验的闭环验证等挑战依然存在。但CellOS的出现标志着AI生命科学进入新阶段:从“看懂”细胞到“理解”细胞,世界模型正在从物理世界走进生命内部。对于AI从业者而言,这不仅是技术路线的创新,更是跨学科融合的典范——当深度学习遇上单细胞组学,下一个突破或许就在细胞与算法的对话中。