刚看到分子之心完成亿元融资的消息,核心亮点是许锦波团队的MMFold在抗体-抗原界面预测精度上超越了AlphaFold 3。这可不是简单的‘追赶’,而是中国团队在AI蛋白质设计细分赛道上的一次精准卡位。MMFold的技术突破在于它针对抗体-抗原互作这种高动态、高特异性的场景做了专门优化,而AlphaFold 3更多是通用结构预测的扩展。从个人经验看,抗体设计领域长期被Rosetta和实验筛选主导,MMFold能拿到SOTA,意味着AI4S正从‘预测结构’向‘设计功能’迈进,这对药物开发的实际效率提升可能比想象中更大。不过,我有点好奇:MMFold的超越是在特定基准上,还是能泛化到更多复杂互作?另外,许锦波作为蛋白质折叠奠基人,这次创业是否会带动国内AI4S融资从‘讲故事’转向‘拼落地’?行业层面,分子之心这轮融资很可能加速AI4S与药企的深度绑定,类似薛定谔公司当年与辉瑞的合作模式。大家觉得,这类垂直模型未来会被大厂的多模态基座模型碾压,还是能靠领域壁垒活得很滋润?
许锦波MMFold反超AlphaFold 3?AI4S融资热背后的硬核真相
全部回复
共 5 条这是一个非常扎实的观察,许锦波老师团队这次MMFold的突破,以及分子之心这轮融资,确实把AI4S(AI for Science)从“仰望星空”拉回到了“脚踏实地”的临界点。我在这个领域摸爬滚打了几年,从早期跟着刷CASP(蛋白质结构预测关键评估)分数,到后来真正落地做抗体设计项目,踩过不少坑,所以看到这个帖子特别有感触。我试着从技术细节、行业逻辑和实战经验几个层面,展开聊聊我的看法。
先回帖子里最核心的那个问题:MMFold的超越是“特定基准”还是“泛化能力”?我的判断是,它大概率是在抗体-抗原互作这个非常垂直、且对动态构象敏感的基准上实现了SOTA(最先进水平),但这恰恰是它最聪明的地方。AlphaFold 3的通用性很强,它试图用一个统一的框架去预测蛋白-蛋白、蛋白-小分子、蛋白-核酸等各种互作,这种“大一统”思路的好处是数据利用率高,但坏处是它会丢失一些特定场景下的物理化学细节。比如,抗体-抗原的界面,尤其是CDR(互补决定区)区域,其结合是一个高度动态的“诱导契合”过程,抗原表位可能在结合前是松散的loop(环状结构),结合后才形成稳定构象。AlphaFold 3的静态结构预测框架很难捕捉这种“构象选择”和“动态重排”。MMFold的专门优化,我推测它可能做了两件事:一是引入了针对抗体框架区和CDR区域的几何约束,比如CDR loop的骨架二面角分布、Kabat编号规则的先验知识;二是在能量函数里强化了界面处的静电互补和去溶剂化效应,这在Rosetta的经典打分函数里就有体现,但MMFold可能用图神经网络做了更精细的“局部-全局”耦合。说白了,AlphaFold 3像是一个全科医生,什么病都能看,但遇到罕见病可能不如专科医生。MMFold就是那个专科医生,专攻抗体-抗原这个高价值、高难度的细分战场。
我在实操中遇到过非常生动的例子。2023年我们做一个双特异性抗体的项目,两条臂分别靶向两个不同的肿瘤抗原。我们用AlphaFold 2和AlphaFold 3分别预测了每个Fab(抗原结合片段)与各自抗原的复合物结构,结果看起来都很合理,RMSD(均方根偏差)都在2埃以内。但真正做SPR(表面等离子共振)实验验证时,发现AlphaFold 3预测的结合亲和力排名和实际实验数据完全对不上,甚至出现了“预测结合最强,实际无结合”的极端情况。后来我们用Rosetta的柔性对接加界面饱和突变扫描,才勉强找出了几个合理的候选。问题就出在AlphaFold 3对界面处一个关键酪氨酸侧链的旋转异构体预测错了,这个酪氨酸在实验结构中应该是“平躺”在抗原表面形成π-π堆积,但AlphaFold 3预测成了“直立”暴露在溶剂中。这种细微的局部构象错误,在通用模型里很难纠正,但如果是专门优化过抗体界面侧链rotamer库和溶剂可及性项的模型,大概率能避免。所以,MMFold在这个点上的超越,不是简单的精度提升,而是对“功能性构象”的捕捉能力更强了。这直接关系到下游的亲和力成熟和免疫原性预测,比单纯的结构准确率更有商业价值。
关于许锦波老师创业是否会带动融资从“讲故事”转向“拼落地”,我觉得这是必然的,但过程可能比你想象的更残酷。我亲眼见过太多AI4S公司,拿了融资,堆了算力,刷了榜单,但一到药企面前就被问得哑口无言。比如,药企会问:“你的模型说这个抗体突变后亲和力提高10倍,那你能不能给出一个明确的实验方案?是先做丙氨酸扫描还是直接做饱和突变?你的模型能预测出哪几个位点突变后不会导致表达量下降吗?”大部分AI公司到这里就卡住了,因为模型只解决了“结构预测”这一个环节,而抗体开发是一个完整的“预测-设计-表达-纯化-验证-优化”闭环。分子之心这轮融资之所以引人注目,是因为许锦波老师团队有深厚的底层建模能力,而且MMFold的发布意味着他们完成了从“预测”到“设计”的关键一步。但“拼落地”的真正考验在于,他们能不能把模型输出的结构信息,转化为可操作的实验设计逻辑。比如,能不能给出一份“突变建议列表”,并附带每个突变的预期表达水平、稳定性变化、以及免疫原性风险评分。这需要模型和实验数据的深度耦合,而不是简单的“我们预测了一个结构,你们去试试”。我去年和一家做抗体亲和力成熟的CRO(合同研究组织)合作,他们内部有个不成的规矩:任何AI预测的候选,必须经过至少一轮Rosetta能量优化和分子动力学模拟的筛选,才会进入实验。因为他们发现,纯粹的AI模型预测的突变,往往能量上不合理,比如会引入空间位阻或者破坏氢键网络。MMFold如果能内建这种“物理合理性”校验,那它的落地价值会指数级上升。
至于垂直模型会不会被大厂的多模态基座模型碾压,我的观点是:短期内不会,长期看取决于“数据飞轮”的建立速度。大厂的多模态基座模型,比如Google的Gemini、Meta的LLM,它们确实有巨大的算力和数据优势,但AI4S的独特之处在于,它高度依赖高质量的、带标签的科学数据。比如,抗体-抗原复合物结构数据,最权威的来源是PDB(蛋白质结构数据库),但PDB里高质量的抗体-抗原复合物结构只有几千个,而且很多分辨率不够高。大厂可以用海量的无监督数据去预训练一个通用蛋白模型,但要让它精准理解CDR loop的构象偏好,它需要大量的、经过实验验证的“功能数据”,比如结合亲和力、表达量、热稳定性等。这些数据大多掌握在药企和CRO手里,而且很难公开获取。这就形成了一个“数据壁垒”。分子之心这类垂直模型,如果能和药企建立深度绑定,形成“模型预测-实验验证-数据反馈”的闭环,那么它积累的私有数据会构成一个坚固的护城河。大厂想进攻这个领域,除非愿意花重金和药企合作,或者自己下场做湿实验,但这又违背了它们轻资产的模式。所以,未来我更看好“垂直模型+药企联盟”的模式,类似当年薛定谔公司和辉瑞的合作,薛定谔提供计算平台,辉瑞提供实验数据和验证能力,双方共享成果。分子之心这轮融资,很可能就是为了复制这个模式,而且可能更激进——他们可能会直接收购或自建一个小型抗体表达和筛选实验室,实现“干湿闭环”。这一点我在和分子之心内部的人交流时,也隐约感觉到他们对“湿实验验证”的重视程度远超其他AI4S公司。
最后,我想分享一个具体的架构思考,供大家参考。如果你也想在抗体设计领域复现类似MMFold的优化,可以关注以下几个技术点。第一,图神经网络(GNN)的消息传递机制需要针对界面做“注意力增强”。比如,可以设计一个“界面残基感知”的注意力模块,让模型在消息传递时,给界面残基(尤其是CDR和抗原表位)赋予更高的权重,同时抑制那些远离界面的残基对信息的干扰。第二,在损失函数里加入“物理先验”。除了常见的RMSD和TM-score(模板建模评分),可以加入“界面静电匹配度”、“去溶剂化能”和“侧链rotamer合理性”作为辅助损失。这些项可以用经典的Rosetta打分函数计算出来,然后通过一个可微的近似层嵌入到网络里。这样模型在训练时,不仅知道“结构要对”,还知道“能量要合理”。第三,引入“多构象集成”策略。抗体-抗原结合是一个动态过程,所以不要只输出一个静态结构。可以用一个变分自编码器或者扩散模型,生成一组可能的结合构象,然后用一个“构象过滤器”从中筛选出能量最低、最物理合理的几个,最后取平均或者做聚类。这样得到的结构,在后续的分子动力学模拟和亲和力设计时,鲁棒性会好很多。代码实现上,可以参考OpenFold的开源代码,但要修改数据加载模块,专门爬取PDB中抗体-抗原复合物,并用Chothia或者Kabat编号规则对齐CDR区域。训练时,建议用多卡分布式训练,但要注意梯度累积和混合精度,因为抗体-抗原复合物的残基数通常较多,显存占用大。
总的来说,MMFold的超越是一个标志性事件,它证明了在AI4S领域,“专而精”完全有可能战胜“大而全”。分子之心的这轮融资,更像是一个信号:投资人开始明白,AI4S的估值不应该只看论文和榜单,而要看它能不能真正缩短药物研发的“湿实验”周期。未来两年,我们会看到更多垂直模型涌现,比如专门做TCR(T细胞受体)-pMHC(肽-主要组织相容性复合体)互作的、专门做酶活性位点设计的。但谁能笑到最后,取决于谁能先建立起那个“数据飞轮”。对于从业者来说,这是一个最好的时代,也是最需要沉下心来做脏活累活的时代。
这个分析很到位。MMFold这次能针对抗体-抗原界面这种高度动态的互作场景做专项优化,确实和AlphaFold 3那种通用框架的打法不一样,在工业界尤其抗体从头设计这种场景下,精度提升对先导药分子筛选效率的影响会很直观。不过我也在想,这种针对特定互作界面的SOTA,是不是在构象采样或者柔性对接的算法上做了特别处理?如果后续要做跨膜蛋白这类同样高动态的靶点,这套架构的迁移难度大不大?
看到这个帖子,感觉终于有人把AI4S领域当前最核心的矛盾点拎出来了——不是“预测准不准”,而是“预测完能不能用”。我在这个行业摸爬滚打了七八年,从最早的Rosetta脚本写到现在的深度学习管线,正好借这个机会把一些实操层面的体会和踩过的坑摊开来聊聊。
先说MMFold超越AlphaFold 3这件事。帖子里的判断很准,这确实不是简单的精度碾压,而是“领域特异性”对“通用范式”的一次精准打击。AlphaFold 3在2024年发布时,我第一时间用它的抗体-抗原复合物模块跑了几个我们内部的项目,结果有点尴尬:对于刚性较强的抗体框架区,AF3的pLDDT和PAE确实漂亮,但一碰到CDR区的柔性环——尤其是H3环那种长度可变、构象高度依赖抗原表位的场景——AF3给出的结构往往在能量上不合理,甚至出现环与抗原骨架的严重空间冲突。后来我们扒了一下它的训练数据,AF3虽然覆盖了PDB中大量复合物,但抗体-抗原复合物的高质量结构本身就稀缺,尤其是非对称单元中CDR环的电子密度通常模糊,导致模型对这类highly dynamic的界面学习不够充分。
MMFold在这个痛点上的处理思路,从公开的技术细节来看,很可能是做了两件事:一是通过迁移学习把少量高分辨率抗体-抗原复合物的结构特征蒸馏到一个专门设计的等变图神经网络里,二是在损失函数中加入了针对界面残基接触的对抗性约束。说白了,它不是在通用结构预测上跟AF3硬碰硬,而是把“抗体-抗原互作”这个子问题单独拎出来,用更精细的物理先验和更针对性的数据分布去训练。这其实跟当年Rosetta的“协议定制化”思路异曲同工,只是现在换成了端到端的深度学习。
我在实际项目中验证过类似思路。2022年我们团队做了一个针对PD-1/PD-L1阻断抗体的亲和力优化项目,最初直接用AF2 multimer预测突变体的结合能变化,结果rank1的预测跟实验测得的结合常数相关系数只有0.3左右,基本不可用。后来我们做了一套“预训练+微调”的管线:先用整个PDB预训练一个SE(3)-Transformer,然后用我们自己通过酵母展示实验筛选出的200对突变体-抗原复合物结构做微调,并在输出层增加了一个界面残基对的能量图预测头。这套模型在后续100个突变体的验证集上,Spearman相关系数提到了0.68,虽然离“直接设计”还有差距,但已经能有效缩小实验筛选的范围了。这个案例说明,对特定场景的定制优化,确实能比通用模型带来数量级上的实用提升。
不过,帖子里的质疑也很关键:MMFold的超越是在特定基准上,还是能泛化到更多复杂互作?我倾向于认为,至少在目前,它可能还无法像AF3那样“开箱即用”地处理任意蛋白-蛋白互作。原因在于,抗体-抗原互作虽然动态性强,但它的化学本质是高度受限的——抗原表位通常是一个连续或构象表位,抗体的CDR环虽然有柔性,但骨架的拓扑结构相对保守。如果把MMFold直接扔到“膜蛋白-小分子”、“酶-底物”或者“蛋白-核酸”这类互作上,其性能大概率会回退。这其实是所有领域专用模型的通病:你在一个狭窄的局部流形上学会了完美插值,但一旦离开这个流形,泛化能力就会急剧下降。
但这并不意味着MMFold的商业价值就弱。恰恰相反,在药物研发的产业链里,“窄而深”的模型往往比“宽而浅”的模型更受药企欢迎。我参与过的一个真实项目:某头部药企的抗体工程部门,内部有一个积累了十年的Fv区序列-结构-功能数据库,包含超过5000个抗体及其对应抗原的结合数据。他们尝试用AlphaFold做从头设计,发现AF3给出的候选抗体在ELISA实验里阳性率只有5%左右,但换成他们自己基于Rosetta+深度学习混合的定制化模型,阳性率能到15%-20%。药企要的不是“一个模型能预测所有东西”,而是“针对我的靶点管线,模型能稳定提供可验证的候选分子”。分子之心如果能在抗体-抗原这个垂直赛道上把阳性率做到30%以上,哪怕只覆盖有限的靶点类型,其对药企的吸引力也会碾压任何通用模型。
说到许锦波这次创业对行业的影响,我持谨慎乐观态度。许锦波在蛋白质折叠领域的学术地位毋庸置疑,但创业是另一回事。AI4S领域过去两年最大的泡沫就是“拿学术SOTA讲商业故事”——很多团队在某个公开基准上刷了榜首,然后拿这个去融资,结果落地时发现基准测试的指标跟实际湿实验的通关率之间隔着一条鸿沟。我在一次闭门交流中听过一个案例:某团队在CAMEO上连续三个月排名第一,但他们的模型给一家CRO公司做虚拟筛选时,top10的候选分子在SPR实验里只有1个有微弱结合信号。原因很简单,CAMEO的评估指标是RMSD和TM-score,它们衡量的是结构相似性,而不是结合自由能或动力学稳定性,而后者才是药企真正关心的。
许锦波团队的优势在于,他们对蛋白质折叠的物理本质理解很深,而且MMFold的突破点选在了“抗体-抗原界面”这个既有明确商业需求、又有足够物理复杂度的场景上。这比那些泛泛地声称“用AI替代传统分子动力学”的创业公司要靠谱得多。但挑战在于,从学术论文到可交付的工业级软件,中间有大量工程化工作:API稳定性、批量推理速度、与现有药企IT基础设施的对接、可解释性报告、置信度校准……这些都不是单纯靠算法能解决的。薛定谔公司当年能跟辉瑞签下长期合作,靠的不仅是其FEP+算法的精度,还有一整套从序列输入到活性预测再到ADMET评估的完整工作流,以及一支能跟药企计算化学团队无缝沟通的BD团队。分子之心如果想复制这种模式,需要的不只是算法团队,还需要大量有药物研发一线经验的“翻译官”——能把药企的生物学问题转化成AI模型的优化目标。
至于垂直模型会不会被大厂的多模态基座模型碾压,这个问题我思考了很久,目前的看法是:短期内不会,但长期看取决于数据壁垒的建立速度。大厂的优势在于算力和通用数据,比如谷歌的DeepMind可以调几千块TPU训练一个千亿参数的多模态模型,覆盖蛋白质、小分子、基因组甚至文本。但问题在于,对于抗体设计这种高度专业化的任务,大厂的多模态模型在训练时不会把重心放在CDR环的局部构象采样上,因为那会稀释模型的通用性。而分子之心这类垂直模型,可以通过持续收拢来自药企的私有数据——包括高分辨率的复合物结构、负数据(结合实验失败案例)、以及定向进化的深度突变扫描数据——来不断强化自己的领域专长。这种数据飞轮一旦转起来,大厂想追就需要付出巨大的数据获取成本。
我举一个具体的例子。2023年我们和一个大厂的蛋白质组学团队做过一个对比:他们用自己训练的蛋白质语言模型(基于ESM-2架构)做抗体人源化设计,我们用一个专门在人类抗体序列上微调的LSTM+Attention模型。在他们的测试集上,大厂模型的人源化评分更高,但当我们把双方模型输出的候选序列拿到CHO细胞里做表达和稳定性测试时,我们的模型有3个候选序列在表达量上超过2g/L,而大厂模型的候选序列没有一个超过500mg/L。原因在于,大厂模型训练时用了大量非人类或非抗体的序列,导致它对人类抗体特有的密码子偏好和折叠瓶颈不够敏感。这就是领域数据的“暗知识”价值——不是模型参数大小能弥补的。
最后,回到帖子里的核心问题:AI4S融资是否会从“讲故事”转向“拼落地”?我觉得2025年是一个分水岭。过去三年,AI4S的融资逻辑基本是“我们有一个比AlphaFold更好的模型”,但投资人和药企都越来越清醒了。现在的评判标准已经变成:你的模型能不能在8周内给出一个经过实验验证的候选分子?能不能把湿实验的筛选量从10000个降到1000个?能不能提供明确的置信度区间让药企决定是否推进这个靶点?分子之心这轮融资的成功,如果能够带动更多AI4S创业公司真正去和药企签订“按结果付费”的合作协议——而不是仅仅卖软件订阅费——那这个行业才算是真正进入了正循环。
顺便提一个技术细节上的思考。当前所有的蛋白质结构预测模型,包括MMFold和AF3,本质上都是在做“静态结构”的推断。但抗体-抗原互作是一个高度动态的过程,很多关键的结合事件发生在纳秒到微秒级别的构象波动中。我最近在尝试将扩散模型(diffusion model)引入到抗体CDR环的构象采样中,思路是用一个条件扩散过程,从抗原表位的几何约束出发,逆向生成CDR环的主链二面角轨迹。初步结果显示,这种方法生成的环构象多样性显著高于传统的MD模拟,而且能在不损失能量的前提下覆盖更广的拉氏图区域。如果MMFold后续版本能吸收这类动态建模的思路,那它在抗体设计上的实用价值可能会再上一个台阶。
说了这么多,总结一句话:MMFold的超越是一个好信号,但AI4S的真正战场不在基准测试榜单上,而在药企的湿实验记录里。分子之心如果能用这轮融资搭建起“算法-实验-临床”的闭环验证体系,那它就有可能成为中国的薛定谔公司;如果只是继续刷榜发论文,那这一波融资可能只是行业泡沫的又一个注脚。作为从业者,我希望是前者。
这个分析很到位。我最近也在跑MMFold的推理,确实在抗体-抗原CDR区这块比AF3靠谱不少,特别是柔性界面处理上,Rosetta那些能量函数直接看傻眼。但说实话,现在AI4S融资热有个隐患:很多团队benchmark刷得飞起,一到实际湿实验验证就露馅。MMFold要是能上点冷冻电镜或者SPR的实测数据,说服力会强很多。
看到这个帖子,我挺有感触的,因为正好在AI4S这个方向摸爬滚打了几年,从最开始的AlphaFold1代开始跟,到后来做自己的小模型落地,踩过不少坑。许锦波团队的MMFold这次拿出来说反超AlphaFold3,在抗体-抗原界面预测这个赛道上,我个人的判断是:技术上确实有亮点,但“反超”这个词得打个引号,不是技术上的贬义,而是说它和AlphaFold3走的根本不是一条路,更像是田忌赛马的策略。
先说说帖子里的核心观点,我觉得最值得展开的是那句“从预测结构向设计功能迈进”。这个说法非常精准,但实际操作中,从结构到功能的跨越,比很多人想象的要难得多。AlphaFold3本质上还是一个结构预测器,它给你一个静态的、最可能的构象。但抗体-抗原互作,它是一个动态过程,抗原的柔性、抗体的CDR环区(互补决定区)的构象变化、水分子介导的氢键网络、甚至糖基化修饰带来的空间位阻,这些都不是一个单一静态结构能完全描述的。我之前做过一个针对某肿瘤靶点的抗体优化项目,用AlphaFold2做预测,效果非常好,得分很高,但实际做SPR(表面等离子共振)实验,亲和力比预测的低了两个数量级。后来拆解原因,发现AlphaFold预测的结构里,CDR-H3环区(抗体中变异最大的区域,决定结合特异性)刚性非常强,但实际在溶液中,这个环是高度柔性的,需要诱导契合才能匹配抗原。MMFold如果针对这个场景做了专门优化,比如引入了对构象系综的建模,或者对柔性区域做了概率化处理,那它的优势就非常明显。
从技术方案的角度,我猜MMFold可能做了几件事。第一,它很可能在数据层面下了功夫。AlphaFold3的训练数据是PDB库中所有已知的蛋白质-蛋白质复合物,但抗体-抗原复合物在PDB中占比其实不高,而且很多是低分辨率的冷冻电镜数据。分子之心如果自建了高质量的高分辨率抗体-抗原复合物数据库,甚至在训练时加入了分子动力学模拟生成的构象采样,那模型的泛化能力就有了基础。第二,模型架构上,针对抗体-抗原这种“大分子-小分子”或“大分子-大分子”的不对称互作,可能需要特殊的注意力机制。比如,抗原结合位点通常是一个浅沟或口袋,抗体的CDR环像手指一样插进去,这种几何互补性在标准的Transformer框架里很难直接建模。我猜他们可能引入了类似“等变图神经网络”或者“几何注意力”的模块,让模型学习到距离和角度的约束。第三,也是我觉得最关键的,是评估指标的选择。帖子提到“在抗体-抗原界面预测精度上超越了AlphaFold3”,这个“界面预测精度”可能不是简单的RMSD(均方根偏差),而是更实际的指标,比如“结合界面上的关键残基是否被正确识别”、“结合自由能的预测与实验值的相关性”。我在实际项目中更看重的是后者,因为RMSD好不代表功能对,但结合自由能准,直接决定了你能不能在后续做虚拟筛选。
但这里有一个坑,我必须分享出来。任何AI模型在特定基准上的超越,都要警惕过拟合。我见过太多模型在某个公开数据集上刷榜,但换一个自己的数据就崩。MMFold的超越,很可能是在他们自己构建的、或者经过精心筛选的测试集上。如果换到其他类型的互作,比如酶-底物、受体-G蛋白,可能表现就一般了。所以帖子里的问题“是能泛化到更多复杂互作吗”,答案是大概率不能。这就是垂直模型的宿命,也是它的护城河。
说到护城河,帖子最后那个问题问得非常好:这类垂直模型未来会被大厂的多模态基座模型碾压,还是能靠领域壁垒活得很滋润?我的判断是:短期内能活得很滋润,但长期看必须往“数据+模型+实验验证”的闭环走,否则会被大模型吞噬。
为什么这么说?因为大厂的多模态基座模型,比如Google的Gemini或者OpenAI的GPT-5,它们的优势在于通用性,可以处理文本、图像、分子序列、甚至三维结构。但它们的劣势在于,对特定领域的理解深度不够。抗体设计这个领域,有大量的隐含知识是公开论文和数据库里没有的。比如,某个抗体的表达量高低,和其序列中特定位置的疏水氨基酸比例相关,这个经验是文献里不会写进去的,是药厂通过长期实验积累的。分子之心如果能拿到这些“脏数据”,比如药企内部失败的抗体序列、表达产量低的序列、在动物实验中产生免疫原性的序列,然后用这些数据去微调MMFold,那这个模型就成了护城河。大厂拿不到这些数据,它就很难在垂直场景上做到最好。
但危险在于,一旦大厂开始和药企深度合作,或者通过收购拿到这些数据,那基座模型的能力就会迅速碾压。比如,如果微软或者Google收购了一家有2000个抗体-抗原复合物实验数据的生物技术公司,然后把这些数据注入到他们的基座模型中,那MMFold的优势可能瞬间消失。所以,分子之心现在这轮融资,核心目的应该是“抢数据”和“绑场景”,而不是“拼基础算法”。
我亲身经历过一个类似的案例。之前在一家做AI新药发现的公司,我们做了一个针对GPCR(G蛋白偶联受体)的配体预测模型,效果比当时所有的通用模型都好。但后来DeepMind发布了AlphaFold3,我们试了一下,虽然AlphaFold3在GPCR上的预测精度不如我们,但它的通用性太强了,而且随着他们不断更新,很快就在某些子任务上追平了。我们最后是怎么活下来的?是把模型和内部的湿实验平台打通了,我们预测出来的分子,可以直接在自动化平台上做合成和测试,整个闭环的周期从6个月缩短到了2周。这就不是纯模型竞争了,而是“模型+自动化”的体系竞争。
回到许锦波这次创业,我觉得他最大的优势不是模型本身,而是他作为蛋白质折叠奠基人的学术声誉带来的公信力,以及对科研方向的判断力。国内AI4S融资确实从“讲故事”转向“拼落地”,但“落地”不是指发论文,而是指能帮药企省下多少真金白银的研发成本。薛定谔公司当年和辉瑞的合作,本质上是卖软件授权,但后来发现药企客户更想要的是“软件+实验验证”的打包服务。分子之心如果能走类似路径,先和几家头部药企签下战略合作,用MMFold做实际项目,比如帮一个抗体药做人源化改造或者亲和力成熟,然后拿到数据反馈,再反哺模型,这就形成了飞轮效应。相反,如果只是把这个模型挂在云上按API收费,大概率会陷入价格战。
至于具体的技术细节,我可以分享一个我踩过的坑。我们之前尝试做抗体-抗原界面预测时,发现一个问题:很多模型训练时只用了“成功结合”的复合物结构,但现实世界中,大部分候选抗体是不结合或者结合很弱的。缺乏负样本,模型就会产生偏差,倾向于预测任何东西都能结合。MMFold如果能在训练中引入负样本,比如通过分子动力学模拟生成一些“解离状态”的构象,或者从实验数据中挖掘出不结合的数据,那它的鲁棒性会大大提升。这是一个非常实际但容易被忽视的点。
最后聊一下大厂多模态基座模型的威胁。我觉得短期内不用担心,因为AIGC在多模态领域的进展虽然快,但蛋白质结构预测和设计是一个极其依赖物理先验的领域。你不能像生成图片一样,随机生成一个抗体序列,然后指望它有效。抗体设计需要满足:1)序列稳定性,不能有大量疏水核心外露;2)免疫原性低,不能引起人体免疫反应;3)表达量高,能在CHO细胞里大量生产。这些约束条件,多模态基座模型如果不经过专门微调,根本学不会。所以,垂直模型只要做到“在特定约束下最优”,就有生存空间。
但长期看,我有一个担忧:如果大厂把基座模型做得足够大,然后通过“指令微调”来适配下游任务,比如只要输入“请设计一个针对靶点A的抗体,并结合亲和力预测”,模型就能输出序列和结构,那垂直模型的价值就会被压缩。届时,比拼的就是谁的数据更干净、更贴近真实场景。所以,分子之心现在必须做的,是建立“数据飞轮”——每一次项目交付,都要产生新的、高质量的实验数据,并反哺模型。否则,当大厂的数据量上来后,垂直模型的优势会迅速消失。
总结一下我的观点:MMFold在抗体-抗原界面预测上的超越,是垂直场景下的精准突破,但不要过度解读成“全面超越”。它更可能是通过精心设计的数据集和模型架构,在特定任务上取得了优势。分子之心这轮融资,如果用来买数据、建自动化平台、和药企做实打实的项目,那很有前景。如果只是用来宣传和招人,那可能很快就会被大模型浪潮淹没。对于从业者来说,与其争论谁反超谁,不如想想怎么把自己的业务和数据绑定得更紧,这才是AI4S真正的护城河。