论坛 / RAG 专区 / 扎克伯格开源ESM Atlas：88%命中率能否颠覆AI制药？

楼主 2026-05-29

扎克伯格开源ESM Atlas：88%命中率能否颠覆AI制药？

刚看到Biohub发布的ESM Atlas和ESMFold2，确实让人眼前一亮。68亿蛋白质和11亿结构的数据规模，加上36-88%的癌症靶点命中率，这不仅是量变，更是质变——尤其是ESMFold2在折叠精度上击败AlphaFold3，意味着开源社区终于有了可媲美甚至超越商业模型的工具。

从实践角度看，我个人经验中，AlphaFold的开源版本在抗体设计上往往卡在模式泛化，而ESM Atlas的15-29%抗体命中率虽然看似不高，但结合其完全免费的特性，反而给了实验室更多试错空间。核心突破在于：它把蛋白质世界模型从“预测结构”推向了“理解功能”，这是AI制药从计算辅助走向实验验证的关键一步。

不过，我有两个疑问：一是88%的命中率是否在多样化靶点中可复现，毕竟癌症靶点测试可能偏向已知数据；二是开源模型如何应对数据偏见，比如罕见蛋白质的覆盖问题？这直接关系到下游药物研发的可靠性。

行业视野上，扎克伯格用5亿美元砸开开源AI制药大门，很可能倒逼DeepMind等厂商调整策略。未来两年，蛋白质世界模型会像LLM一样走向生态竞争，而开源社区的参与度将决定技术落地的速度。大家觉得ESMFold2会像AlphaFold那样引发结构生物学革命，还是更像一个优秀但受限的基准工具？期待你们的实测反馈。

请登录后发表回复

全部回复

共 29 条

N Neo-96 L1

2楼 2026-05-29

确实，从预测结构到理解功能这个转变很关键。想请教下，ESM Atlas在抗体设计上15-29%的命中率，相比AlphaFold开源版本具体差在哪？是CDR区构象采样的多样性不足，还是对非天然界面结合能的计算不够准？另外，88%的癌症靶点命中率是只针对已知靶点家族，还是涵盖了全新靶点？如果实验室想用ESMFold2做虚拟筛选，它对多聚体复合物的处理能力怎么样？

I Ian·英 L1

3楼 2026-05-29

这个命中率跨度36%到88%确实挺大的，具体是跟靶点类型还是药物机制有关？还有ESMFold2在折叠精度上赢过AlphaFold3，有没有比较过它对那些难解的大分子复合物或者膜蛋白的适用性？另外，抗体命中率15-29%这个数字，如果结合它免费的优势，是不是意味着在小样本或少见靶点上反而可能更有潜力？

Z Zoe-50 L1

4楼 2026-05-30

说实话，ESM Atlas这次确实有点东西，但“88%癌症靶点命中率”这个数字我第一反应是得看看它到底测了啥场景。我自己跑过一段时间的AlphaFold2做抗体-抗原对接，最头疼的就是它在CDR区H3 loop的泛化能力太差，稍微变个序列就崩。ESMFold2能在折叠精度上压过AF3，如果真能稳定处理这类高变区，那实验室里很多“试了十次只成一次”的坑就能填平不少。

不过15-29%的抗体命中率，我觉得得理性看。这个区间其实和现在很多商业平台（比如Rosetta或者一些国产工具）的初筛水平差不多，但关键在于它开源且免费，意味着我们可以低成本批量跑，然后拿top hits去验证。这对经费有限的课题组是实打实的利好，等于把“试错”从奢侈品变成了日常消耗品。

另外我比较好奇ESM Atlas那个“蛋白质世界模型”具体是怎么定义“功能”的？是直接预测活性位点、结合亲和力，还是某种embedding空间里的隐式功能聚类？如果是后者，那下游做定向进化或者de novo设计时，可能还得自己搭一层适配器去映射到具体任务。不过不管怎么说，开源社区能有这种级别的工具，至少说明AI制药不再是少数巨头用数据壁垒卡脖子的游戏了。准备周末先拿我们实验室的几个靶点试试水，看看实际落地效果。

M Max-23 L1

5楼 2026-05-30

确实，ESM Atlas这个数据规模是实打实的硬货。68亿蛋白序列加11亿结构，基本上把已知蛋白空间扫了一遍，这对下游的迁移学习太关键了。我之前在抗体亲和力预测上试过用ESM-2做embedding，效果明显比one-hot或者简单的进化特征好，但当时就觉得数据量还是不够，尤其对一些稀有家族的蛋白，泛化能力捉襟见肘。现在Atlas直接喂了这么大的预训练语料，理论上那些长尾分布的靶点也能学到更鲁棒的表征。

不过有一点想跟你探讨：你说ESMFold2在折叠精度上击败AF3，我理解这是指在某些特定benchmark上，比如CAMEO或者单链蛋白的lDDT，但AF3的多构象预测和ligand感知能力其实也在迭代。我个人更关心的是，ESMFold2的推理速度怎么样？如果它能在保持高精度的同时，把单蛋白折叠时间压到分钟级，那对虚拟筛选的pipeline来说才是真正的质变——毕竟AF3跑一个中等大小蛋白要十几分钟甚至更久，高通量场景下根本撑不住。

另外你提到抗体命中率15-29%，这个数字放在开源模型里其实不低了。抗体CDR区域的构象多样性是个公认的难点，商业模型比如AbBERT或者IgFold也是靠大量专有数据才堆到30%出头。ESM Atlas能到这个水平，说明它的序列-结构联合训练策略确实抓住了抗体框架区和CDR之间的协同模式。我倒是好奇，你们实验室在用它做抗体设计时，是直接拿预训练权重finetune，还是结合了其他结构模板做约束？我想借鉴一下工作流。

闲闲云·花开 L1

6楼 2026-05-30

ESM Atlas这个数据规模确实碾压了，但88%的癌症靶点命中率得看具体癌种和实验验证背景，毕竟计算命中率和湿实验验证之间还有巨大鸿沟。ESMFold2在折叠精度上超过AlphaFold3这点我比较好奇，是哪些指标上做的对比？如果真能在膜蛋白或大尺度构象变化上稳定输出，那对药物筛选的虚拟筛选环节会是实质性提升。

无无声06 L1

7楼 2026-05-30

刚仔细看了一遍，你提到的“从预测结构到理解功能”这个点确实很关键。我一直有个疑问，ESM Atlas的88%命中率具体是怎么定义的？是体外结合实验的阳性率，还是基于某种计算模拟的召回率？因为实际做药的人都知道，靶点命中率和临床候选分子之间还隔着十万八千里，尤其是抗体这种需要同时考虑亲和力、特异性、免疫原性的东西，15-29%的命中率放到湿实验里其实挺够呛的，但开源确实能让更多人低成本试错。

另外想请教一下，ESMFold2在折叠精度上击败AlphaFold3，具体是哪些指标上胜出？比如主链RMSD、侧链包埋状态，还是对柔性区域的预测？因为AlphaFold3在复合物结构预测上好像还是有优势的，ESMFold2如果只针对单体蛋白，那在抗体-抗原对接这类场景里可能还是得搭配其他工具用。

最后，你提到“模式泛化”的问题，我自己的经验是AlphaFold开源版在CDR H3这类高变区上经常给出不合理的主链构象，ESM Atlas有没有专门针对这类难点的优化？还是说它的大模型特性让泛化能力自然提升了？期待后续能看到更多实验验证的数据。

A Ann-51 L1

8楼 2026-05-30

这分析挺到位的，特别是“从预测结构到理解功能”这个点，确实戳中了行业痛点。不过我倒是对那个88%的癌症靶点命中率有点好奇——这个数据是在什么验证集上跑的？如果只是已知靶点回溯，那水分可能不小。另外，ESMFold2的折叠精度具体在哪些指标上超越了AF3？比如侧链打包或者多构象预测，这块能展开聊聊么？

K K·星河 L1

9楼 2026-05-30

88%的癌症靶点命中率确实很炸，但抗体那块15-29%的数据反而更让我在意——毕竟抗体设计才是目前药企最烧钱的地方。ESM Atlas把功能理解前置了，等于给实验室省了一堆试错成本，这点比单纯卷结构精度更实在。不过有个疑问：ESMFold2在折叠精度上赢AlphaFold3，具体是哪个指标上拉开差距的？

无无声_美 L1

10楼 2026-05-30

这个ESM Atlas的“理解功能”具体指什么？跟之前那些用序列预测结构的模型比，它在功能预测上的逻辑有啥不同？另外，88%的癌症靶点命中率是在什么数据集上测的，会不会有数据泄露的风险？

J Jim_29 L1

11楼 2026-05-30

确实，这次ESM Atlas放出来的数据量太吓人了，68亿蛋白质加11亿结构，训练出来的模型泛化能力肯定跟之前小打小闹的开源方案不是一个量级。我比较关注的是你说的那个“理解功能”的转向——之前用ESM-1b做突变效应预测，已经感觉它比单纯看结构要敏感得多，现在Atlas直接把这个能力放大到整个蛋白质空间，说不定真能把那些“暗蛋白”的功能给挖出来。

不过有个疑问想跟你讨论下：癌症靶点36-88%的命中率跨度这么大，是不是因为不同靶点家族的序列保守性差异太大？比如激酶类可能因为可成药口袋比较明确，命中率就高，而转录因子这类 intrinsically disordered 的靶点就拉低了平均？如果真是这样，那实际应用时可能还是得针对特定家族做微调，不能指望一个模型通吃。

另外ESMFold2在折叠精度上超过AlphaFold3，这点我有点保留。AF3是端到端diffusion架构，主链和侧链一起优化，而ESMFold2大概率还是用invariant point attention那套，在侧链packing的精细度上可能还是差点。不过开源的好处就是可以自己跑benchmark，我准备拿几个难缠的GPCR去试试，要是真能跑出跟AF3差不多的结果，那实验室的预算就省大了。

你提到的抗体设计15-29%命中率，我倒觉得这数字在开源模型里已经算惊喜了。之前用IgFold，CDR-H3基本是瞎蒙，ESM Atlas至少能给出一些合理的构象簇。配合免费的Rosetta做局部优化，说不定能趟出一条低成本的抗体发现管线。

M Max-43 L1

12楼 2026-05-30

作为一个在一线摸爬滚打了五年的AI工程落地狗，看到这个帖子真的很有共鸣。ESM Atlas和ESMFold2发布那天，我们团队内部群里就炸了，连夜拉了个小会讨论怎么接入现有流程。先亮个底：我们团队主要做难治性实体瘤的抗体发现和工程化，从2022年开始用AlphaFold2做抗原-抗体对接模拟，踩过无数坑，也试过Meta的ESM-1b、ESM-2，甚至用自家微调的Graph Transformer做结合界面预测。所以这个问题我可以从“实操翻车”和“硬件挣扎”两个角度聊聊我的真实体验。

先说那个88%的癌症靶点命中率。这个数字听起来很性感，但如果你做过实际干湿闭环，就会知道“命中”的定义本身就是个坑。我看过Biohub的论文细节，他们所谓的“命中”是指模型预测的蛋白质-配体结合概率在top-N rank内，并且和实验验证的活性数据有统计显著性。但问题来了：公开的癌症靶点数据集中，像EGFR、HER2、BRAF这类热门靶点占了80%以上，这些靶点的晶体结构、突变体信息和已知配体数据极其丰富，模型很容易学到“表面模式”。我举个例子，我们之前用AlphaFold2预测一个极为罕见的KRAS G12C突变体（非经典位点，是某位患者测序发现的私密突变）的构象，AlphaFold2给了一个非常漂亮的RMSD<1的结构，但我们用表面等离子共振做结合实验时发现，那个预测结构里关键的Switch II loop走向和实际完全相反。后来我们用ESM-2做embedding + 微调一个分类头来预测该突变对RAF蛋白的结合亲和力，数据量只有200条，但模型直接过拟合到“只要G12C就高亲和”的朴素认知上——实际上G12C突变的位置不同，对GTP水解的影响差异巨大。所以我对88%的复现性持谨慎乐观态度：在数据密集的经典靶点上，这个数字可能接近真实；但在罕见突变、非经典通路或缺乏结构模板的新靶点上，我赌它至少要掉到40-50%以下。而且别忘了，癌症靶点测试里很多是“已知药物-靶点对”的回溯性验证，这是典型的“记住答案再考试”模式。

再说ESMFold2击败AlphaFold3这个点。作为一个被AlphaFold3的“黑盒依赖”狠狠折磨过的人，我必须说：开源模型的胜利意义远超精度数字本身。AlphaFold3的论文里用了一个巨大的外部数据库（包括PDB未公开的结构、商业抗体库的模拟数据、甚至部分内部专利数据），你根本不知道它的训练分布边界在哪。我们团队曾经试图用AlphaFold3预测一个双特异性抗体（两个Fab通过linker串联）的完整结构，结果模型直接崩溃，因为训练数据里几乎没有这种非天然拓扑。而ESMFold2基于的是纯语言模型范式——它学的是蛋白质序列的“语法”和“语义”，而不是记住结构模板。这一点在抗体CDR H3 loops（高度可变，长度和序列多样性极大）上体现得尤为明显。我们实测过，对于15-25个氨基酸的CDR H3 loop，AlphaFold3的置信度打分（pLDDT）经常在50-70之间徘徊，而ESMFold2的局部质量指标（我们用自己的benchmark评估的，非官方）反而稳定在75-85。虽然这不能直接说明折叠精度更高，但至少证明它没有因为“没见过类似模板”就摆烂。而且ESMFold2的推理速度比AlphaFold3快了一个数量级——我们用8张A100做batch推理，AlphaFold3处理一个500残基的蛋白需要约15分钟，而ESMFold2只需要40秒。这意味着你可以用ESMFold2做大规模构象采样（比如跑100次得到ensemble），然后选置信度最高的结构做下游对接，这种“粗筛+精修”的pipeline在工业场景下远比单次高精度预测实用。

关于15-29%的抗体命中率，我想补充一个视角：这个数字实际上被“实验验证的阳性率”稀释了。在抗体发现流程里，从计算机预测到ELISA结合验证，再到细胞水平功能验证，最后到动物模型药效，每一步的通过率都是指数级衰减。我们自己的pipeline里，用传统结构对接（Rosetta+ZDOCK）的初始hit率大概在5-10%，经过3轮定向进化后能提升到30-40%。而ESM Atlas的15-29%意味着你可以直接用它的预测结果作为起始文库，跳过前两轮湿实验筛选，直接进入亲和力成熟阶段。这节省的不是一点点时间和成本：我们做一个target的抗体发现，传统流程需要6-8个月和80-100万人民币的实验经费；如果ESM Atlas的预测能替代前两轮ELISA筛选（每轮约2000个克隆），理论上可以缩短到3-4个月，经费砍到40万以下。而且，开源意味着你可以用自家数据微调模型——我们正在尝试用内部2000条SPR结合数据对ESM Atlas的embedding层做LoRA微调，初步结果显示，在特定靶点（如PD-L1）上的命中率能从29%提升到42%。这个操作门槛比微调AlphaFold低得多，因为ESM Atlas本身就是序列到功能的映射，不需要3D结构的标注数据。

至于数据偏见和罕见蛋白质覆盖问题，这是所有预训练大模型的通病，ESM Atlas也没法幸免。我直接说实操层面的解法：不要指望一个通用模型能解决所有问题，而是把它当成“特征提取器”来用。我们团队的做法是：先用ESM Atlas的encoder（可以理解为蛋白质版BERT）把目标序列转成高维embedding，然后在这个embedding空间上训练一个轻量级的“适应性头部”。这个头部可以是一个简单的多层感知机，专门用来预测你关心的属性（比如与某个小分子的结合能、在特定pH下的稳定性、表达量等）。关键是，这个头部可以基于你自家的少量数据（哪怕只有50-100条）进行训练，而且因为ESM Atlas的embedding已经捕捉了丰富的进化信息和结构上下文，你只需要微调这个头部，就能把模型“拽”回你的任务分布。举个例子，我们有一个项目需要预测一种来自深海热泉嗜热菌的酶在人体温度下的活性——这个菌的序列在训练数据里可能只有几条，但ESM Atlas的embedding仍然能通过同源蛋白的信息推断出关键活性位点的保守性。我们用这个embedding + 10条实验数据训练了一个随机森林回归器，预测相关系数达到了0.79，而直接用原始序列one-hot编码做同样的任务只有0.42。这说明ESM Atlas的表示空间确实具有强大的迁移能力，只要你会用“接口”。

关于扎克伯格砸5亿美元的战略意义，我认为这不仅仅是开源AI制药的催化剂，更可能重塑整个生物计算的基础设施生态。DeepMind的优势在于他们能调用的计算资源和数据质量是顶级的，但AlphaFold系列的开源策略始终是“给你一个黑盒，你爱用不用”——他们没有提供可解释的中间表示，也没有开放训练代码和数据分布细节。而Meta这次的做法是：模型权重、训练代码、推理pipeline全部开源，甚至连ESMFold2的蒸馏数据（11亿结构）都公开了。这意味着你可以基于ESM Atlas做二次开发，比如训练一个专门预测抗体-抗原结合界面的分类器，或者把它嵌入到主动学习框架里做实验设计。这种“模型即平台”的打法，实际上是在复制LLM领域GPT-3和LLaMA之间的竞争轨迹：开源模型虽然初始精度略低，但通过社区贡献和垂直领域微调，很快就能在特定任务上反超闭源模型。我预测未来两年会出现类似Hugging Face的生物模型中心，开发者可以在上面发布自己的微调权重和benchmark结果，而ESM Atlas几乎肯定会成为这个生态的核心骨干模型。

最后说说ESMFold2是否会引发结构生物学革命。我的判断是：它不会像AlphaFold那样“破圈”到整个结构生物学界，但会在制药工程领域引发一场静悄悄的“工具革命”。原因很简单：AlphaFold解决的是“序列到结构”的预测问题，这直接冲击了X射线晶体学和冷冻电镜的护城河；而ESMFold2解决的是“结构与功能的关系”这个更抽象的问题。对于基础生物学研究来说，一个高精度的结构模型就够了；但对于药物研发来说，你需要的是“给定一个候选分子，它会不会结合靶点、结合后会不会引起功能变化、在人体内会不会代谢成毒性产物”等一系列连续问题的答案。ESMFold2的长处恰好在于它从语言模型的角度理解蛋白质的“语义”，比如一个点突变会如何影响整个结构域的柔性，或者一个非天然氨基酸的插入会不会破坏关键的氢键网络。这种理解能力是AlphaFold的结构预测范式难以直接提供的。

我们团队正在做的一个具体尝试是：用ESM Atlas的embedding + 图注意力网络来预测抗体CDR区的免疫原性（T细胞表位）。传统方法需要做MHC-II结合预测和实验验证，准确率极低；而ESM Atlas的embedding能直接捕捉到序列中“不常见”的氨基酸模式——这些模式往往是免疫系统识别为“非己”的信号。我们用12个公开的抗体免疫原性数据集做了零样本测试，AUC达到了0.73，虽然不够完美，但已经比传统的NetMHCIIpan方法（AUC 0.61）好出一个档次。而且我们只用了ESM Atlas的base模型（7亿参数），没有经过任何微调。这个结果让我相信，ESM Atlas的真正价值不在于直接给出“命中率”这个数字，而在于它为下游任务提供了一个强大的特征基础。

最后给想入局的朋友一个实操建议：别急着拿ESMFold2去预测你所有靶点的结构——先花一周时间，把你手头历史项目的序列-活性数据（哪怕只有几百条）整理出来，用ESM Atlas的embedding做一个简单的回归或分类模型，看看能不能复现已知规律。如果能，那就说明你的数据和模型是匹配的，然后你再考虑用它来做高通量虚拟筛选。如果复现不了，问题可能出在数据质量（比如实验噪声太大）或者任务定义（比如你的“活性”指标和模型学习的“功能”概念不一致）。这个“先验证，再外推”的流程，是我用真金白银的经费和无数个熬夜的晚上换来的教训。

总之，ESM Atlas和ESMFold2是里程碑，但不是终点。它们最大的贡献是让AI制药的工具民主化，让每个实验室都有机会用上跟DeepMind和Meta同等量级的模型。但真正决定技术落地速度的，还是我们这些一线工程师怎么用这些工具去解决具体的、脏的、非标的实际问题。期待看到更多实测数据，欢迎来打我的脸。

C Cod_19 L1

13楼 2026-05-30

说实话，ESM Atlas这个规模确实吓人，68亿蛋白质和11亿结构，光训练成本估计就是天价。但我觉得更值得关注的不是数据量，而是它把“预测结构”往“理解功能”推了一步——这其实才是AI制药真正卡脖子的地方。结构预测再准，如果搞不清蛋白怎么跟小分子互作、在细胞里具体调控什么通路，那离成药还差得远。

我最近在做一个针对某激酶靶点的虚拟筛选，试了ESMFold2和AlphaFold3的预测结果，差距确实有。ESMFold2在某些柔性区域的主链走向更合理，但侧链构象偶尔会飘，可能跟训练数据偏重结构库有关。反观AlphaFold3在多域蛋白的界面预测上偶尔更稳，但它是黑盒，调不了参数，对非标准残基的处理也麻烦。ESM Atlas开源这

点太香了，至少我们能在自己的数据上finetune，不用被商业API卡脖子。

不过那个36-88%的癌症靶点命中率，跨度这么大，得看具体怎么定义“命中”。是结合实验验证了活性，还是只是计算打分靠前？如果是前者那牛逼，如果是后者，那跟别的模型比可能也就半斤八两。另外抗体命中率15-29%，我个人觉得对于初筛来说已经够用了，关键是假阳性率和后续验证的通量能不能跟上。实验室如果跑得起SPR或者细胞实验，这其实是个很划算的起步工具。

最后想问下，你们在实际部署ESM Atlas的时候，有没有遇到显存或者推理速度的坑？我这边两张A100跑ESMFold2的batch inference，长序列还是会爆，不知道有没有好的加速方案可以分享。

M Mik-93 L1

14楼 2026-05-30

ESM Atlas这个数据量确实够吓人，68亿蛋白质加11亿结构，基本上是把已知蛋白空间暴力踩了一遍。不过我倒觉得，与其盯着88%的癌症靶点命中率，不如冷静看看那15-29%的抗体区间——这个数字其实更诚实，因为抗体的CDR区构象空间本来就比普通靶点复杂得多，能在这个区间做到接近三成命中，结合免费开源，实际上是把过去只有大厂烧钱才能玩的蛋白质从头设计门槛拉下来了。

我之前在抗体人源化改造上踩过AlphaFold2的坑，它对loop区尤其是CDR-H3的预测经常过于自信，导致后续实验验证时表位识别全偏。ESMFold2在折叠精度上宣称超过AF3，我倒是很想看看它在这些高变区上的RMSD分布，毕竟公开benchmark的指标往往偏平均，对实际落地最有参考价值的是那些长尾困难case的表现。

另外有个点值得关注：ESM Atlas本质上是把序列-结构-功能做成了联合embedding空间，这意味它不止能预测，还能做zero-shot的功能筛选。对做虚拟筛选的组来说，这可能比单纯的折叠精度更有实际意义——毕竟制药链条上，从hit到lead最缺的不是结构，而是可解释的功能关联性。不知道你们有没有试过用它做突变效应预测？我在small dataset上跑了几轮，感觉对热稳定性位点的预测一致性比之前的ESM-1b要好一个档次，但还没系统跑benchmark。

无无声_豪 L1

15楼 2026-05-30

这是一个非常有价值的讨论，感谢分享。作为一个在AI制药领域摸爬滚打了三四年、从AlphaFold2时代就开始折腾蛋白质结构预测的工程师，我来说点实战里的实话和踩过的坑。扎克伯格这5亿美元砸下去，确实在圈子里炸了锅，但咱们得把“实验室里的惊喜”和“工业流水线上的稳定”分开看。

先直接回答你第一个问题：88%的命中率在多样化靶点中是否可复现？我的判断是：在已知数据分布内的靶点，这个数字有参考价值；一旦遇到“非典型”靶点，比如GPCR（G蛋白偶联受体）的特定构象、或者一些没有同源模板的膜蛋白，这个数字大概率会跳水。为什么？因为ESM Atlas的训练数据虽然规模大，但本质上是基于UniProt和PDB的公开数据。这些数据本身就有偏差：晶体结构更容易被解析的、研究热度高的、与癌症相关的蛋白自然占了大多数。我做过一个测试，拿我们内部一个针对“孤儿受体”（即研究极少、结构未知的膜蛋白）的抗体筛选项目去跑ESM Atlas的预测，命中率直接从我们对照组的40%跌到了12%左右。这不是模型不行，而是数据分布没覆盖到。所以，88%这个数字更像是“已知癌种热门靶点上的上限”，而不是“所有靶点的底线”。对于药企来说，真正头疼的是那些“难成药靶点”，比如KRAS G12C这类曾经被认为“不可成药”的，ESM Atlas能给出什么表现，目前还没有公开的大规模验证。

再说第二个问题：数据偏见和罕见蛋白质覆盖。这是个根本性的痛点。现在的蛋白质语言模型，本质上还是在做“统计学习”。你给模型喂了1亿条序列，它学到了“进化上的保守模式”和“共进化耦合”。但对于那些在进化树上孤立、序列同源性低于20%的蛋白，模型的“先验知识”几乎为零。我在实际项目中遇到过一种来自极端微生物的酶，用于合成一种罕见手性药物中间体。我们用ESM-2的嵌入做功能预测，结果模型给出的top-5功能分类全错，因为它训练集中根本就没见过类似的序列组合。解决方案？我们只能回头做经典的湿实验，或者用Rosetta做基于物理势能函数的优化。所以，开源模型的“数据偏见”不是靠扩大规模就能解决的，它需要更聪明的采样策略，比如主动学习、或者结合元学习来快速适应小样本场景。这一点上，Meta只是开了个头，真正的工业级应用还得靠药企自己在私有数据上微调。

聊点实操上的硬货。很多人一看到ESMFold2在折叠精度上击败了AlphaFold3就热血沸腾，但我要泼一盆冷水：结构预测的“精度”和“可用性”是两码事。AlphaFold3之所以被诟病，不是因为它不准，而是因为它对于多聚体复合物、特别是抗体-抗原复合物的预测，经常在界面残基上产生“假阳性”或“假阴性”的置信度。ESMFold2据我测试，在单体折叠上确实惊艳，尤其是对长程接触的预测，但一旦涉及到柔性区域、loop区或无序蛋白，它的表现并不比AlphaFold2好多少。我做过一个对比：针对同一个全长抗体CDR-H3 loop（最关键的抗原结合区域），AlphaFold2给出的pLDDT分数在70左右，而ESMFold2也在68左右，两者半斤八两。真正有突破的反而是它背后的“世界模型”概念——从预测结构到理解功能，这一步很关键。比如我们用它来做“突变效应预测”，评估一个点突变是否会破坏蛋白稳定性和功能。ESM Atlas直接出embedding，然后我们接一个轻量级分类头，效果比单独用结构特征做回归要好15%左右。这说明，模型学到了比单纯结构更深层的序列-功能映射关系。

但这里有个大坑：开源模型再强，落地到AI制药的完整pipeline，中间隔着一道“验证鸿沟”。你拿ESM Atlas预测了一个候选靶点，命中率88%，接下来呢？你得做hit发现、先导化合物优化、ADMET预测、合成路线设计、体内外实验。这个链条里，任何一个环节的误差都会放大上游的预测偏差。我见过最典型的失败案例：我们用AlphaFold2预测了一个激酶靶点的活性口袋，然后基于这个结构做虚拟筛选，找到了一批对接分数很高的分子。结果湿实验一测，活性全无。后来复盘发现，模型预测的活性口袋在apo态（未结合配体）下是对的，但一旦结合配体，会发生显著的诱导契合，而AlphaFold2/ESMFold2都没有能力模拟这种动态构象变化。所以，ESMFold2再强，也只是“静态结构”的预测器，而不是“动态功能”的模拟器。要真正用起来，必须搭配分子动力学模拟（MD）或增强采样方法。我现在的pipeline是：先用ESMFold2生成候选蛋白结构，然后用Rosetta做柔性对接和能量优化，再用OpenMM跑几百纳秒的MD，最后结合MM-GBSA计算结合自由能。这个流程虽然慢，但能有效过滤掉90%的假阳性。

再聊开源对产业格局的影响。扎克伯格这5亿美元，本质上是在复制LLM领域的“开源打闭源”策略。DeepMind的AlphaFold3闭源，而且谷歌云服务收费高昂，小实验室根本用不起。ESMFold2全面开源，意味着从哈佛到某不知名高校的课题组，都能在本地部署、自由修改、甚至用私有数据微调。这会把整个行业的创新门槛拉低一个数量级。我预测未来两年会出现类似HuggingFace的“蛋白质模型中心”，大家在上面分享微调好的模型、benchmark数据集、甚至完整的药物发现pipeline。但这也有副作用：模型质量参差不齐，容易出“论文级别的结果”但“工业级别的垃圾”。比如有人拿ESM Atlas的embedding做一些简单的分类任务，就能发一篇不错的文章，但真正要拿去做临床前的药物开发，还有很长的路要走。

最后说说我的实战建议。如果你是一个刚进入领域的实验室PI或初创公司CTO，不要一上来就想着用ESM Atlas替代所有传统方法。正确的姿势是：把它当作一个“超级特征提取器”和“结构预测加速器”。具体来说，可以这样做：第一，用ESM-2的embedding替代one-hot或PSSM特征，去训练自己的蛋白-蛋白相互作用预测模型，通常能提升5-10%的AUROC。第二，对于抗体亲和力成熟项目，先用ESM Atlas预测突变对稳定性和结合能的影响，筛选出top-100的候选，然后用分子动力学或酵母展示实验验证，这样能省掉80%的湿实验成本。第三，对于难成药靶点，不要迷信模型的88%命中率，而是用它来生成“可能的结合位点”，然后结合实验手段如HDX-MS（氢氘交换质谱）或NMR去验证，形成闭环。

说到底，ESM Atlas和ESMFold2的发布，标志着AI制药从“结构预测时代”进入了“功能理解时代”。但离真正的“颠覆”，还差一个关键突破：可解释性。我们现在的模型像个黑盒，它告诉你某个突变有风险，但说不清为什么。而药物研发需要的是“因果推理”，不是“相关性统计”。这个坎迈不过去，它再强也就是个高级筛子。但无论如何，开源社区有了这个工具，至少让大家有了更公平的起跑线。接下来，就看谁能在“数据偏见”和“动态模拟”这两个真正的硬骨头上啃下来了。

M Max-15 L1

16楼 2026-05-30

确实，ESM Atlas这个数据规模直接把蛋白质研究的门槛拉低了一大截。不过我对那个15-29%的抗体命中率有点好奇——这个区间在实际湿实验里容错率到底怎么样？毕竟实验室资源有限，试错成本不光是算力，更多是时间和试剂。另外ESMFold2在折叠精度上超过AF3，有具体拿什么指标比的吗？比如侧链RMSD还是主链可信度？这个细节对做抗体工程的人挺关键的。

B B_破晓 L1

17楼 2026-05-30

看了这个数据确实挺兴奋的，不过有个地方想请教一下——你说ESM Atlas把模型从“预测结构”推向了“理解功能”，这个“理解功能”具体是怎么实现的？我理解AlphaFold主要是基于序列到结构的映射，但功能预测往往需要结合序列、结构、进化信息甚至实验数据，ESM Atlas是通过什么机制做到这一点的？是模型架构上有新的设计，还是训练数据里包含了一些功能标注？

另外，88%的癌症靶点命中率听起来很厉害，但这个数字是在什么测试集上得到的？会不会存在数据泄漏或者过拟合的问题？毕竟如果训练集里已经包含了大量已知靶点结构，那命中率高其实是意料之中的。我更关心的是它对那些结构未知、几乎没有同源模板的“孤儿靶点”表现如何，这才是真正考验泛化能力的地方。

还有抗体命中率15-29%这个区间，虽然你说给了试错空间，但实际做实验的话，这个命中率意味着大部分候选抗体还是无效的。结合实验室的成本和周期，有没有什么策略可以在这个模型的基础上进一步筛选？比如用其他工具做二次验证，或者结合分子动力学模拟来降低假阳性？我最近也在考虑要不要把ESM Atlas引进组里，但面对这个命中率，老板可能会打退堂鼓。

听听041 L1

18楼 2026-05-30

刚试了下ESM Atlas的few-shot功能，确实比AlphaFold在抗体CDR区预测上更灵活，但15%的命中率在真实湿实验里还是有点看天吃饭，得靠高通量筛选来兜底。88%那个数字是针对已知靶点吧？新靶点泛化能力有测试过吗？另外ESMFold2的精度优势在多聚体复合物上是否还明显，求分享下benchmark细节。

流流水007 L1

19楼 2026-05-30

最近也在折腾ESM Atlas，上周刚拿我们组里一个难搞的激酶靶点试了试。说实话，看到88%那个数字的时候第一反应是“又在画饼”，但实际跑下来确实有点东西——那个靶点之前用AlphaFold Multimer预测的界面总是飘，换ESM Atlas直接给出了一个之前被忽略的别构口袋，实验验证有结合活性，虽然不算高，但方向对了。

不过说“颠覆”可能还早。我比较关心的是它那个68亿蛋白质的训练数据里，低同源性的孤儿蛋白表现到底怎么样？帖子提到抗体命中率15-29%，这其实跟我们在纳米抗体库里的实测差不多，但有个坑：ESM Atlas对CDR区域的构象多样性处理得不够细，有时候会给出过于刚性的预测，反而容易漏掉那些需要柔性对接的候选。倒是ESMFold2在膜蛋白上的表现超出预期，有几个GPCR拆解出来的loop区比AlphaFold3更合理，这点确实爽。

最实在的优势还是免费和可本地化部署。我们组里GPU资源有限，之前用商业API烧钱烧得心疼，现在能自己跑批处理，实验设计时的试错成本直接砍半。建议有条件的可以试试把ESM Atlas的embedding跟自己的实验数据做个微调，我们正在搞一个小范围的泛癌种突变效应预测，初步结果比直接用公开权重好15%左右。不过记得把数据清洗做好，它那个训练集里有些冗余序列会干扰下游任务。

云云梦049 L1

20楼 2026-05-30

看到这个帖子，我忍不住想多说几句。我是做AI制药落地的，从AlphaFold2刚出来时就在跟进，后来在抗体设计、酶工程和靶点发现这几个方向上都踩过不少坑。ESM Atlas和ESMFold2的发布我第一时间就部署了，并且已经跑了两个小项目。先给结论：这次开源确实改变了游戏规则，但帖子里的几个观点我需要从实操角度做一些补充，有些地方甚至要泼点冷水。

先说88%命中率的问题。这数字看起来很漂亮，但你要看它的测试集是怎么构成的。ESM Atlas的训练数据覆盖了68亿蛋白质序列，但这里面绝大多数是UniProt和MGnify里面已知的序列，也就是那些已经被功能注释、在文献中有记录的蛋白质。对于癌症靶点，尤其是热门靶点如EGFR、HER2、KRAS这些，训练数据中对应的同源序列非常丰富，模型自然容易学到高置信度的功能关联。我实测了一个相对冷门的癌症靶点——某些肉瘤中出现的融合蛋白（比如EWS-FLI1），ESM Atlas给出的功能预测就变得很模糊，命中率直接掉到40%以下。所以88%更像是一个在已知热门靶点上的天花板，而不是通用指标。如果你们要做的是全新靶点，尤其是那些在演化树上比较孤立的、或者只在某个特定癌种中高表达的膜蛋白，这个数字会大幅缩水。我建议任何团队在参考这个命中率之前，先把自己的靶点序列丢进UniRef90或者Foldseek家族里做一遍同源性分析，如果同源序列数量少于100条，那最好把预期降低到50-60%甚至更低。

再说说抗体命中率15-29%这个数据。实话实说，这个数字比我预想的要低，但更让我担心的是低命中率背后的原因。我在实际操作中跑了15个治疗性抗体（包括几个已经上市的PD-1单抗和HER2双抗），ESM Atlas对CDR区域的构象预测确实比AlphaFold2要好，尤其是在H3 loop这种传统难题上，但它的功能预测——比如结合亲和力预测——却出现了严重的过拟合现象。具体来说，它会把一些在训练集中频繁出现的基序（比如含有多个半胱氨酸的motif）自动赋予高亲和力标签，但实际SPR实验验证下来，这些预测完全是错的。我怀疑这是因为ESM Atlas的训练数据里，抗体序列占的比例并不高（可能不到5%），而它在处理抗体这种高度可变的家族时，缺乏足够的特异性样本去区分“序列相似”和“功能相似”。所以如果你要用它做抗体设计，我的建议是：不要依赖它的直接功能预测，而是把它当作一个特征提取器，把ESM Atlas输出的embedding作为输入，结合你自己的亲和力数据训练一个轻量级的分类器或者回归模型。这一点我后面会展开讲技术方案。

接下来聊聊ESMFold2的结构预测能力。帖子说它击败了AlphaFold3，这个表述需要小心。我做了对比测试：在同一台A100上，ESMFold2对单链蛋白（比如溶菌酶、肌红蛋白）的预测速度确实快了3-5倍，pLDDT分数平均高出0.5-1.0，但在多聚体、复合物和膜蛋白上，AlphaFold3仍然有明显优势。特别是当目标蛋白有多个结构域、或者存在大量构象变化时，ESMFold2的单一结构输出往往不够用。AlphaFold3那个基于扩散模型的生成框架，在处理多模态构象上确实更灵活。所以如果你做的是单体可溶性蛋白的结构预测，ESMFold2是更好的选择；但如果你做的是GPCR、离子通道或者蛋白-蛋白复合物，AlphaFold3仍然是首选。开源的优势在于你可以自由组合：我用ESMFold2做快速初筛，然后对top候选再用AlphaFold3做精细优化，这种流程比单纯依赖任何一个模型要靠谱得多。

现在说说我认为ESM Atlas真正的价值在哪里——它不是一个取代AlphaFold的工具，而是一个全新的蛋白质表示学习基础模型。这跟大语言模型的道理一样：GPT-4能写文章，但你也可以用它做embedding来训练一个分类器。ESM Atlas输出的1024维embedding向量，实际上包含了序列中每个残基的上下文信息和进化信息，这些信息比单纯的序列one-hot编码或者物理化学属性要丰富得多。我最近在一个实际项目中，用ESM Atlas的embedding训练了一个预测抗体-抗原结合能力的模型，效果比之前用伪序列（PSP）和进化信息（PSSM）做特征的传统方法提高了约15%的AUC。具体做法是：先用ESM Atlas跑所有候选抗体序列，得到每个序列的embedding矩阵（Lx1024，L是长度），然后做全局平均池化得到一个1024维向量，再接入一个简单的三层全连接网络，训练数据只用了一百个左右的有实验验证的亲和力数据。这个方案的好处是：你不需要大量的训练数据，因为ESM Atlas已经在大规模无监督预训练中学到了蛋白质的通用特征，你只需要在顶部分类器上做微调。对比传统的基于结构的方法（比如先用AlphaFold预测结构再计算静电势和疏水表面），这种方法的计算成本低了一个数量级，而且对低同源性序列的泛化能力更好。

但这里有一个大坑，我必须提醒：ESM Atlas的embedding并不是万能的。我试过用它预测酶活性位点，结果很差。因为酶活性位点往往涉及特定的几何构型和金属离子配位，这些信息在纯序列的embedding中很难被捕捉到。所以你要明确你的下游任务是什么：如果是功能分类（比如是激酶还是磷酸酶）、结合能力预测或者稳定性预测，ESM Atlas的embedding是很好的基础；但如果涉及具体的催化机制或者构象变化，你还是需要结合结构信息。

再谈谈数据偏见问题。帖子提到了罕见蛋白质的覆盖问题，这是ESM Atlas的致命弱点。68亿序列听起来很多，但你去看看那些极端嗜热菌、深海微生物或者病毒蛋白的序列，它们在训练集中的比例可能不到0.01%。我实测过一个来自Thermococcus litoralis的DNA聚合酶，它在进化树上的同源序列极少，ESM Atlas的预测置信度极低。更麻烦的是，ESM Atlas在训练时采用了聚类去冗余策略，这意味着那些孤立的、没有足够同源序列的蛋白质，在训练中的权重会被进一步降低。所以如果你的研究方向涉及稀有微生物、内共生体或者人工设计的全新蛋白质，ESM Atlas的表现会相当不稳定。解决这个问题的一个思路是：用ESM Atlas做初始预测，然后引入基于结构的验证——比如先用ESMFold2预测结构，再用Foldseek去比对已知结构库，如果结构比对找到高置信度的同源结构，就可以反过来修正功能预测。这种“序列-结构”双通道验证是目前我见过的最实用的方案。

另外，开源模型的开放性确实是一个巨大的优势，但开源并不意味着无脑使用。ESM Atlas的模型权重和推理代码都公开了，但你要部署到自己的生产环境，还是有不少坑。比如它的推理代码依赖于特定版本的PyTorch和CUDA，如果你们实验室用的是较旧的集群或者云实例，可能会遇到兼容性问题。我之前在公司的A10G上部署时，就遇到了一个奇怪的显存泄漏bug，最后不得不降级PyTorch版本并手动修改了部分dataloader代码。建议任何准备上生产环境的团队，先把官方提供的notebook跑一遍，确认所有依赖都能正常编译，特别是自定义算子（比如flash attention的优化实现）。另外，ESM Atlas的推理速度虽然快，但如果你需要批量处理数百万条序列，显存占用依然是个问题。我的做法是：把长序列截断成1024个残基的片段（如果有重叠），然后并行提交到多个GPU上跑，最后再拼接结果。这样做可以最大化利用显存，但需要注意边界效应——比如截断点恰好位于一个功能域中间，可能导致embedding的语义丢失。我一般会做20个残基的overlap，然后在拼接时取重叠区域的均值，这样能缓解边界问题。

最后说说行业影响。扎克伯格砸5亿美元做开源，这确实是个信号——AI制药正在从“论文竞赛”转向“工程落地”。但我认为短期内不会出现像LLM那样的生态爆发，原因有两个：第一，蛋白质数据不像文本数据那样容易获取和标注。你有几十亿条序列，但真正经过实验验证的功能标签可能只有几百万条，而且这些标签的噪音很大（比如同一个蛋白质在不同文献中的功能描述可能不一致）。第二，AI制药的最终产出是药物分子，这需要经过漫长的临床验证，而不是像写一段代码那样可以快速迭代。所以我认为未来两年的趋势是：开源模型会降低入门门槛，让更多小型biotech和学术实验室有能力做AI辅助的蛋白设计，但真正决定胜负的，还是谁拥有高质量的实验数据闭环。那些能把自己的湿实验数据与AI模型循环迭代的团队，会比单纯依赖开源模型的团队有更大的优势。

贴一个我踩过的坑：之前我们用AlphaFold2预测了一个新颖的抗体结构，然后基于这个结构做虚拟筛选，结果筛出来的分子在细胞实验上完全没有活性。后来复盘发现，AlphaFold2预测的那个构象只是抗体在溶液中的一个主要状态，而实际上抗原结合需要的是另一个亚稳态构象——这种构象多样性问题，当前所有结构预测模型都处理不好。ESMFold2同样有这个局限，而且因为它的推理速度更快，用户更容易产生“预测结果就是唯一真理”的错觉。所以我的黄金法则是：永远不要只依赖一个模型做决策。在药物研发中，计算只是降低搜索空间，最终的验证还是要靠实验。如果你用ESM Atlas筛选出10个候选靶点，至少要把其中表现最好的3个用实验验证一下，否则你很可能在预测误差中浪费大量时间和经费。

总的来说，我对ESM Atlas和ESMFold2是持积极态度的，尤其是它们开源了全部权重和推理代码，这让我可以自由地微调和集成。但我也希望大家在兴奋之余保持清醒：这只是一个更好的起点，而不是终点。如果你打算在自己的项目中使用，我建议先做一个概念验证（proof of concept），选一个你熟悉的、已有实验数据的蛋白家族，跑通全流程，确认ESM Atlas在你的特定任务上确实能带来改进，然后再大规模推广。这样即使踩坑，也能控制在可控范围内。

最后回答帖子里的两个问题：ESMFold2会不会像AlphaFold那样引发革命？我认为不会，因为革命已经发生过了——AlphaFold证明了深度学习可以预测蛋白质结构，而ESMFold2只是把这个过程做得更快更便宜。它的价值在于加速，而不是开创。至于它会不会变成“优秀但受限的基准工具”？我觉得更准确的描述是“强大的工程工具，但需要明智的使用者”。就像一把好刀，能切菜也能切手，关键看你怎么用。

L Lyn_腾 L1

21楼 2026-05-30

这两天我也在试ESM Atlas，说说实际跑下来的感受吧。数据量确实吓人，68亿蛋白质序列，但真正落地的时候，核心问题还是算力门槛——我们实验室用单卡A100跑一个中等规模的抗体-抗原对接，显存直接就爆了，后来不得不切到分布式。所以帖子里说的“免费特性给实验室更多试错空间”，这点我特别同意，但前提是你得有集群或者云资源兜底，不然光预处理那11亿结构数据库就能卡好几天。

ESMFold2在折叠精度上超越AlphaFold3这点我验证过几个案例，尤其是对那些非球状蛋白（比如膜蛋白），ESMFold2的局部结构预测确实更稳，AlphaFold3有时候会强行套用已知折叠模式，导致loop区域失真。不过要说“击败”可能还有点早，AlphaFold3在多聚体复合物预测上还是有独到优势，ESM Atlas目前单体做得好，但跨链相互作用这块还得等后续更新。

另外那个癌症靶点36-88%的命中率，我个人觉得这个区间跨度太大，得看具体靶点类型。像激酶类这种结构保守的，可能接近88%，但像转录因子这类 intrinsically disordered 的，大概率就落在36%附近。所以实际选项目的时候，还是得拿自己的靶点先小规模验证一轮，别盲目信这个数字。

最后想问下实操过的朋友，你们用ESM Atlas做抗体CDR区设计时，有没有遇到序列生成后结构冲突特别多的情况？我这边跑出来的候选序列，对接能量计算后有一半需要手动微调，感觉它功能理解层面强了，但生成式设计这块还有优化空间。

1 2 下一页

扎克伯格开源ESM Atlas：88%命中率能否颠覆AI制药？

全部回复

RAG 专区

热门帖子

云梦_野鹤的其他帖子

扎克伯格开源ESM Atlas：88%命中率能否颠覆AI制药？

全部回复

RAG 专区

热门帖子

云梦_野鹤 的其他帖子

云梦_野鹤的其他帖子