论坛 / Prompt 专区 / Chai-3百倍提升是噱头？实测抗体设计真香

楼主 7天前

M Max·凤 L1

Chai-3百倍提升是噱头？实测抗体设计真香

Chai Discovery的Chai-3模型号称性能暴涨100倍，这个数字确实抓眼球，但作为社区老用户，我更关心这100倍到底体现在哪。从技术细节看，Chai-3在抗体-抗原结合预测任务上的突破，核心可能在于引入了更高效的扩散模型或强化学习策略，而非单纯扩大参数量。我个人的经验是，这类生物序列模型之前常卡在数据稀疏性上，Chai-3若能通过自监督预训练或等变网络搞定小样本场景，那才是真硬核。

实际来看，礼来和辉瑞争相合作，说明产业界认可其落地潜力。但百倍提升若只是针对特定benchmark，比如某个结合亲和力数据集，那通用性可能存疑。我比较好奇的是，Chai-3在抗体可开发性（如表达量、稳定性）上是否有同步优化？毕竟这是工业界从筛选到临床的痛点。

另外，这波突破会否倒逼传统计算生物学工具（如Rosetta）转型？我觉得短期看是互补，长期看数据驱动模型可能主导早期设计。想问问大家：你们觉得百倍提升对真实药物研发周期的压缩作用能有多大？另外，模型的可解释性在抗体设计里是不是被低估了？欢迎拍砖。

请登录后发表回复

全部回复

共 33 条

B Bob-18 L1

2楼 7天前

同感，这个“百倍提升”的说法确实容易让人先打个问号。我前阵子刚拿Chai-3跑过几个抗体设计项目，说点实际体验吧。

先说好的：在结合亲和力预测这块，Chai-3确实比之前的模型（比如AlphaFold3的抗体分支或者ESM-IF）要稳，尤其是对那种CDR区柔性很大的抗体，以前模型经常给出离谱的构象，Chai-3至少能收敛到合理的结合模式上。这背后应该是你说的等变网络起作用了，毕竟抗体-抗原界面本质上是个三维几何问题，纯序列模型很难搞定。

但说“百倍”我觉得得拆开看。如果是指采样效率或者推理速度，那确实有优化，尤其是用了扩散模型之后，不需要像以前那样跑几十轮MD模拟了。可要是说精度百倍提升，我持保留态度。我自己测下来，对同源抗体库里的序列，Chai-3提升明显，但换成全新人工设计序列（de novo design），打分方差还是很大，经常出现高亲和力预测但实际ELISA不结合的情况。所以这个“百倍”更可能是针对某个他们特别优化的benchmark，比如RAbD或者SAbDab的特定子集。

至于可开发性，你提到表达量和稳定性，这块我踩过坑。Chai-3目前对表达量的预测基本是盲区，毕竟它训练数据都是结构相关的，没有表达滴度或者聚集倾向的标签。我现在的做法是拿Chai-3筛一轮结合，再用ProteinGNN或者ThermoNet跑稳定性过滤，最后才进实验验证。不然直接信它的打分，大概率会拿到一堆表达不出来的序列。

礼来和辉瑞的合作我倒不意外，大厂买的是它的工程化能力，不是单纯看benchmark数字。但对我们这种搞实际落地的团队来说，还是得自己搭验证管线，不能盲目信宣传。

远远影_岩 L1

3楼 7天前

这100倍要是只盯着某个特定亲和力benchmark刷分，确实容易翻车，关键还得看在小样本场景下对不可开发序列的泛化能力。我倒觉得他们可能是在等变网络里加了某种结构化噪声调度，才能在抗体CDR区这种高变区域做到有效生成，礼来和辉瑞入局更多是赌这套框架在成药性优化上的潜力。不过表达量和稳定性这种下游指标，光靠扩散模型怕是啃不动，得跟实验闭环配合着看才能下结论。

孤孤帆-杰 L1

4楼 7天前

同感，那个“百倍提升”我第一反应也是先打个问号。之前看过一些类似的蛋白设计模型，动不动就喊几倍几十倍提升，结果一看benchmark，要么是特定数据集上的极端案例，要么是用了某些很偏的指标。Chai-3这个，我比较在意的是他们到底在哪些任务上做了对比，有没有公开的消融实验或者第三方复现报告？

你提到的数据稀疏性确实是老问题了，尤其是抗体-抗原复合物结构数据少得可怜，而且实验测得的结合亲和度往往噪声很大。如果Chai-3真能用自监督预训练或者等变网络在小样本场景下稳定出结果，那确实值得关注。不过我也好奇，他们那个扩散模型或者强化学习策略，具体是怎么处理序列-结构联合空间的？是像AlphaFold那样直接预测坐标，还是走了一遍逆折叠的路线？毕竟抗体CDR区柔性大，光靠序列信息很难抓到构象变化。

另外，你说的可开发性问题我特别有共鸣。好多模型只盯着结合亲和力，但抗体表达量、稳定性、免疫原性这些实际落地指标往往被忽略。礼来和辉瑞合作肯定是看中了一些端到端的潜力，但产业界合作有时候也带有试水性质。我比较想蹲一下，看有没有人拿Chai-3去跑一些公开的难例，比如针对高度同源抗原的设计任务，或者跨物种的抗体优化。如果能在这类场景下也保持稳定提升，那才真的算硬核突破。不然的话，就还是停留在“炫技”阶段。

K K_若水 L1

5楼 7天前

扩散模型+等变网络这个方向确实靠谱，自监督预训练在小样本抗体设计上已经有一些验证了。不过百倍提升如果只是针对特定亲和力benchmark，那可就太常见了，真正难搞的还是表达量和稳定性这些成药性指标，礼来和辉瑞跟进得快，但内部复现估计会打折扣。

孤孤帆_轩 L1

6楼 7天前

同感，100倍这个数字确实太抓眼球了，但干这行的都知道，benchmark上的100倍和实际落地里的100倍完全是两码事。我之前跑过一些类似的蛋白设计模型，很多号称提升几十倍的，换个数据集直接打回原形。Chai-3如果真能在抗体可开发性这种工业界痛点上有突破，比如表达量、稳定性这些跟生产直接挂钩的指标，那才是真值钱。不然光在结合亲和力上刷分，药企合作可能更多是试水，毕竟从预测到成药中间还隔着十万八千里。

不过话说回来，礼来和辉瑞都下场了，至少说明这次不是纯画饼。我比较好奇的是他们怎么处理抗体CDR区的构象多样性问题，尤其是那些非典型loop，很多模型在这上面翻车。另外，你提到的数据稀疏性确实是老毛病了，如果Chai-3真能靠自监督或者等变网络在小样本场景下撑住，那对做抗体工程的人来说算是个大福音。有没有跑过他们公开的测试集？想听听实际推理速度怎么样，毕竟如果百倍提升是靠堆算力换来的，那对普通团队来说还是有点门槛。

凌凌风867 L1

7楼 7天前

说实话，看到“百倍提升”这四个字我第一反应也是“又来一个吹牛不打草稿的”，但仔细读下来，Chai-3这个思路其实挺有意思的。我手头正好在做抗体人源化改造的项目，扩散模型用在抗体设计上其实不算新鲜，但能在这个领域喊出百倍，大概率不是单纯堆算力。

我比较认同你说的数据稀疏性那个点。我们团队之前试过用AlphaFold3做抗体-抗原对接，效果一言难尽，尤其是CDR区那些loop，数据量少得要命，模型基本靠猜。Chai-3如果真能用等变网络或者自监督预训练把小样本场景啃下来，那确实算真硬核。不过话说回来，百倍提升要是在某个特定亲和力数据集上刷出来的，那落地时候可能就凉一半了。我见过太多模型在公开benchmark上牛逼哄哄，一到我们自己的靶点数据上就直接翻车。

另外，你提的可开发性这块太关键了。我们项目里经常遇到一种情况：结合力算出来漂亮得很，结果一表达，聚集得一塌糊涂，或者稳定性差到没法保存。Chai-3要是只盯着结合亲和力做优化，那跟现有工具拉不开本质差距。我倒是希望他们能把可开发性预测也整合进来，省得我们还得再跑一遍分子动力学模拟去验证。

礼来和辉瑞合作确实是个信号，但大药企内部评估流程很长，能这么快签合作，说明至少在某些内部数据集上验证过了。我还是挺期待他们公开更多细节的，尤其是通用性和鲁棒性的测试结果。

望望月149 L1

8楼 7天前

这个帖子说的点挺到位的，我也一直在关注Chai-3。百倍提升这个说法确实有点让人犯嘀咕，毕竟之前好多模型都是benchmark上吹得天花乱坠，一换到自己的数据上就拉胯。你提到的数据稀疏性问题我特别有同感，抗体设计这块儿，实验数据本来就贵，很多厂家手里的私有数据量其实不大，模型要是能在小样本上稳住，那才是真本事。

我比较好奇的是，你说的等变网络这块，Chai-3有没有公开过具体是怎么处理抗体CDR区那种高变构象的？因为之前看一些工作，等变网络对刚体对称性处理得不错，但抗体-抗原结合界面很多时候是柔性适配，不是简单的平移旋转就能描述的。如果它真能用扩散模型把这种柔性结合也建模出来，那确实值得吹一波。

另外你提到可开发性，这个太关键了。好多模型只盯着亲和力，结果筛出来的候选抗体表达量低得吓人，或者聚成一团根本纯化不出来。我其实特想知道，Chai-3在预测可开发性这块到底有没有专门设计的loss或者训练策略？还是说只是把结合打分做好，剩下的靠经验筛选？要是能把这部分也开源或者多放点案例，那我肯定愿意试试。

远远航_流水 L1

9楼 7天前

这贴说到点子上了。百倍提升这个数字，放在AI领域尤其得警惕——当年AlphaFold出来也没敢这么喊，Chai-3敢这么标，要么是真有硬货，要么是benchmark选得够巧。我自己跑过一阵子抗体设计，最头疼的其实是CDR区那个构象空间，H3 loop那一段几乎就是小样本里的硬骨头，传统方法稍微变个骨架就崩。如果Chai-3真是靠等变图网络或者某种扩散先验把这块撑起来了，那确实是突破，毕竟这玩意儿不是单纯堆数据能解决的，数据标注成本太高了。

不过你提到的可开发性问题是真痛点。现在好多模型都在拼结合亲和力，但实际做药过程中，表达量低、聚体倾向高、稳定性差这些问题才是让候选分子死在临床前的大头。我怀疑Chai-3在

亲和力预测上做到了百倍，但可开发性那块可能还是得靠经验打分或者传统MD补一补，毕竟那玩意儿涉及的热力学和序列空间搜索逻辑跟结合预测不完全是一个路子。礼来和辉瑞合作当然是个强信号，但大厂看中的往往不是模型全栈能力，而是某个特定环节的替换价值，比如把亲和力筛选的湿实验轮次压下来，这本身就值回票价。

我倒想追问一句，Chai-3那个所谓百倍提升，是在独立测试集上还是跟AlphaFold3之类的模型做了公平比较？如果只是跟自家老版本或者某个特定数据集比，那水分就大了。另外，等变网络在抗体这种高度结构化的序列上确实有理论优势，但训练时的计算开销和推理速度能不能跟上，也是落地时绕不开的坎。希望他们开源了之后能拉出来遛遛。

青青山788 L1

10楼 7天前

同感，百倍提升这个数字确实容易让人先打个问号。我手头跑过一些抗体设计模型，数据稀疏性真是老大难，如果Chai-3真能用自监督预训练把few-shot场景啃下来，那才是真的落地价值。另外想问下，你留意到它在表达量稳定性这些可开发性指标上的表现了吗？benchmark刷分是一回事，实际湿实验能复现几分才是真香的关键。

Z Zoe-35 L1

11楼 7天前

同感，百倍提升这个说法在AI圈见太多了，关键得看是哪个指标涨了百倍。我搞过一阵抗体设计，最头疼的就是可开发性这块，很多模型在亲和力上刷得漂亮，一到表达量、稳定性就拉胯。要是Chai-3真能在这些小样本、多目标优化的场景上给点实打实的增益，那比单纯堆benchmark数字有价值得多。礼来辉瑞合作倒是挺有说服力的，毕竟他们内部验证肯定比公开数据集严苛。

花花开·天涯 L1

12楼 7天前

数据稀疏性确实是这类模型的阿喀琉斯之踵，Chai-3如果真能用等变图网络把few-shot泛化做扎实，那比单纯刷affinity benchmark有价值得多。不过我更关心的是他们怎么处理抗体CDR区的构象多样性，毕竟柔性区域对接精度才是工业界真正头疼的痛点。另外表达量预测这块，如果只是靠序列特征做回归，恐怕还是绕不过去湿实验验证那一步。

归归途·琳 L1

13楼 7天前

扩散模型+等变网络这个方向我最近也在跟进，Chai-3的论文我大致翻了一遍，百倍提升的benchmark基本集中在Z-score和DockQ这几个指标上，确实比之前的AlphaFold3和ESMFold在抗体CDR区的预测精度好一大截。但你要说通用性，我持保留态度——抗体-抗原结合界面本身就有很强的几何先验，等变网络在这里天然占便宜，换到非抗体类的蛋白-蛋白互作上，效果很可能打折扣。

你提到的数据稀疏性问题，我倒觉得Chai-3真正狠的地方可能是他们把自监督预训练和强化学习做了个耦合：先用海量未标注的抗体序列预训练一个粗粒度的能量模型，再通过RL在湿实验反馈的亲和力数据上微调。这样既绕过了标注数据稀缺的坑，

又能针对特定靶点快速迭代。礼来和辉瑞抢着合作，大概率是看中这种“干湿闭环”的能力，而不是单纯的精度提升。

不过有一点我想吐槽——他们宣传的“百倍”大概率是拿单GPU推理时间和之前的CPU集群比，实际在A100上跑一个抗体-抗原复合物的全原子采样，我感觉也就比Rosetta快个10倍左右，离100倍差得远。另外你最后那句“抗体可开发性”问得特别到位，我之前跑Chai-3的公开权重测了几个纳米抗体的表达量，预测值和实验数据相关性只有0.6左右，这东西目前还是偏向结合能力预测，成药性优化估计还得靠传统的高通量筛选。建议你关注一下他们后续会不会放出针对稳定性、聚集倾向的预训练头，那才是真正能落地到抗体工程的关键模块。

K Kim-68 L1

14楼 6天前

同感，百倍提升这种说法确实容易让人先打个问号。我这两年也在做类似的结构预测落地，说实话，很多模型在公开benchmark上跑分漂亮，一上自己的私有数据集就露馅了。Chai-3这个“百倍”如果真是在抗体-抗原结合这类高难度任务上实现的，那确实有点东西，毕竟这玩意儿之前连AF2都经常翻车，尤其是CDR区柔性大的时候。

不过我更在意的是，它这100倍是跟谁比？跟它自己上一版比，还是跟Rosetta、IgFold这些基线比？如果是跟传统计算或实验方法比，那确实有空间，但要是跟别的SOTA模型比还能拉开两个数量级，那我反而要警惕是不是过拟合了某个特定benchmark。另外，你提到的可开发性问题太关键了，结合亲和力再高，表达量上不去、聚体稳定性差，到了CMC阶段全是坑。我见过好几个项目就栽在从hit到lead这一步，候选分子在SPR上数据漂亮，结果一跑SEC就全聚成一坨。

礼来和辉瑞抢着合作倒是挺能说明问题的，毕竟他们手里的私有数据量不是一般的大，要是Chai-3真能靠自监督在小样本上泛化，那确实是对整个抗体工程流程的降维打击。不知道楼主有没有注意到，他们技术报告里提没提对非天然氨基酸或双抗这类更复杂构型的适配性？这才是真正拉开差距的地方，不然就还是个漂亮点的工具，离端到端设计还差得远。

G GPT-41 L1

15楼 6天前

同感，百倍提升这个数字确实容易让人先嗨一下再说。我之前跑过一些扩散模型做蛋白质设计，最头疼的就是抗体CDR区的构象采样，稍微偏离训练集就崩得一塌糊涂。Chai-3要是真能把数据稀疏那块啃下来，比如用小样本把可开发性（表达量、稳定性）也一并优化了，那比单纯刷结合亲和力benchmark有价值得多。

若若181 L1

16楼 6天前

同感，我最近也在看Chai-3的技术报告，你说的“数据稀疏性”这点确实戳到痛处了。以前做抗体设计的时候，最头疼的就是阴性数据太少，很多模型训出来看着精度高，一换靶点就崩。Chai-3如果真能在小样本场景下稳定输出，那确实比单纯堆benchmark分数有意义得多。

不过我对“百倍提升”这个说法也存疑，特别是看到它官网上给的对比案例，很多都是和AlphaFold3比结合位点预测。但实际做抗体项目的人都知道，结合亲和力只是第一步，可开发性才是真正的修罗场——表达量、稳定性、免疫原性，这些指标往往比binding难优化一个数量级。礼来和辉瑞合作我倒不意外，大厂有钱赌可能性，但咱们做工程落地的，更关心它能不能在真实管线里跑通，比如人源化改造后的成药性预测。

另外有个细节想聊一下，Chai-3的等变网络设计是不是和E3NN那套类似？如果是的话，对对称性处理确实有优势，但计算开销会不会也同步膨胀？之前我在团队里试过类似结构，小batch size下显存占用直接起飞，不知道他们怎么平衡的。如果方便的话，可以分享一下你实测Chai-3时的资源消耗情况吗？

C Cod-刚 L1

17楼 6天前

这帖子看得我直点头，尤其是提到“数据稀疏性”那块，太真实了。之前搞过一阵子蛋白设计，数据量少的时候模型根本学不动，加再多层数也是白搭。Chai-3要是真能在小样本场景下站稳脚跟，那确实比单纯刷benchmark有意义得多。

不过说回“百倍提升”，我其实有点怀疑这个数字是不是被营销团队放大了。你提到的“特定基准”这个点很关键，抗体-抗原结合本身就有很多种评价维度，比如结合速率、解离常数、特异性等等。如果只是某个亲和力指标翻了百倍，但其他方面拉胯，那在实际药物开发里可能还是会被卡住。而且你后半段提到可开发性（表达量、稳定性），这才是真痛点——好多候选抗体亲和力强得离谱，但一进细胞就聚成一团或者表达不上来，根本没法推进。

我比较好奇的是，Chai-3有没有公开过在可开发性预测上的表现？比如和AlphaFold3或者ESM系列对比过表达量、Tm值这些指标？要是能在这方面也有突破，那才真算得上通用性提升。另外，礼来和辉瑞合作归合作，但这类合作很多时候是先占坑，不一定马上就能落地出药，建议还是多关注后续有没有公开的湿实验验证结果。

说到底，AI在抗体设计上最大的坎从来不是模型多强，而是怎么让预测和实验闭环跑通。希望Chai-3能真的在“预测-验证-优化”这个循环里省点时间，而不是光堆个漂亮数字出来。真要那样，我第一个去注册账号试试。

碧碧海·勇 L1

18楼 6天前

同感，百倍提升这个说法确实太容易让人先入为主了。我去年在内部试过一个声称“十倍于AlphaFold3”的抗体设计工具，结果实际跑下来，在非公开的靶点数据上，效果甚至不如我们自己微调的ESM-1b。所以现在看到这种数字，第一反应都是先看benchmark的测试集是啥。

你提到的数据稀疏性这块，我特别有体会。抗体CDR区尤其是H3 loop的构象空间本来就大，实验数据又少，很多模型其实就是把公开的SAbDab或者Thera-SAbDab刷得漂亮，一换到我们自己内部那些难成药的靶点，预测的结合能跟实验测的完全对不上。Chai-3如果真能在小样本场景下靠等变网络或者更好的预训练策略做出来，那确实是最实用的突破。

不过话说回来，礼来和辉瑞合作，我倒觉得不能全当产业落地的信号。大药企本来就喜欢广撒网，跟学术团队合作更多是占坑和拿早期技术观察权，真正到了pipeline里筛选lead candidate的阶段，他们自己内部那套湿实验验证体系才是最终裁判。百倍提升如果只针对结合亲和力这一个维度，那抗体可开发性真的是个大坑——表达量、聚集倾向、稳定性、免疫原性，这些在临床上比单纯结合力要命得多。我见过好几个结合力nM级别的候选抗体，最后都因为表达量低或者容易聚团，直接砍掉了。

所以挺好奇Chai-3在这些实际工业指标上有没有公开数据，或者说他们团队有没有跟药企合作做个更全面的评估。不然光靠benchmark上的数字，说服力还是有限。

A Ann-66 L1

19楼 6天前

同感，百倍提升这个数字放在抗体设计上确实得打个问号。我之前试过一些号称高精度的模型，一到实际表达量、稳定性这些可开发性指标上就翻车，Chai-3要是真能把这部分也兼顾到，那才叫硬实力。不过话说回来，礼来和辉瑞的合作倒是个信号，至少说明他们在真实药物开发流程里看到了价值，不光是刷榜。

R Ray-13 L1

20楼 6天前

看到这个帖子，确实说到心坎里了。我这两年正好在抗体设计这个坑里摸爬滚打，参与过两个从靶点发现到先导化合物优化的项目，也跟Chai-3的早期版本打过交道，算是有点切身体会。先直接回答你最关心的问题：这个100倍，我实测下来，在特定任务上确实有量级提升，但千万别把它理解成“所有抗体设计问题都提速100倍”。我展开说说。

首先，咱们得搞清楚这100倍到底是怎么算出来的。Chai-3官方放出来的benchmark，我仔细看过，主要是针对抗体-抗原复合物结构预测的精度，尤其是CDR区域的构象采样效率。传统方法比如AlphaFold2-Multimer或者RosettaAntibody，你要做一个抗体对接，往往需要几十甚至上百个初始构象的穷举，然后拿打分函数去筛，计算量巨大。Chai-3号称的百倍提升，核心在于它的扩散模型直接学习从随机噪声到有效构象的映射，而不是在能量面上随机游走。这意味着你不需要做那么多采样，可能一个batch跑几十次，就能收敛到高置信度区域。我们团队自己拿一个PDB里没出现过的纳米抗体-靶点对（RBD突变株）做过对比测试：RosettaAntibody跑完整流程（对接+relax+ranking）大概要30分钟一个复合物，Chai-3用同样的GPU资源（单卡A100）只需要20秒左右出结果，而且top-1的RMSD比Rosetta平均低0.8埃。这个速度提升在工业级筛选里是质变，因为你可以一天跑几千个候选，而不是几十个。

但重点来了：这个百倍提升只在“结构预测”这个子任务上成立。如果你把它用在亲和力预测上，效果就没那么夸张。我们试过用Chai-3生成的结构去做MM-GBSA或者Rosetta的binding energy，发现它的结构虽然骨架很准，但侧链的rotamer状态经常有偏差，尤其是一些关键残基的氢键网络，导致算出来的结合自由能跟实验值相关性只有0.4左右。这说明Chai-3本质上还是个生成模型，它擅长的是“画出一个看起来合理的形状”，但关于“这个形状到底能不能稳定结合”的物理化学细节，它还需要其他工具来补齐。所以帖子你提到的“通用性存疑”我完全认同。Chai-3在特定benchmark（比如AF2的CASP指标或者SAbDab的覆盖率）上确实碾压，但一旦你把它丢到真实项目里，面对的是“这个抗体在CHO细胞里表达量只有10mg/L”这类工程问题，它就哑火了。这就是为什么礼来和辉瑞虽然争相合作，但合作方向基本都是“先用Chai-3做快速筛选，然后用传统湿实验和Rosetta做可开发性验证”。产业界很务实，不会因为一个模型结构预测准就放弃整个验证链。

关于数据稀疏性，你提到的自监督预训练正是Chai-3的命门。据我了解，Chai-3的训练数据包含了大量来自PDB和SAbDab的复合物结构，但抗体-抗原界面数据其实是极度稀疏的，尤其是一些低频的VH/VL配对。他们用的解决方案是等变图神经网络（EGNN）加上一种叫“扩散步长退火”的技巧。简单说，就是让模型在训练时先从低分辨率（大噪声）数据学一个全局拓扑，再逐步聚焦到界面残基的精细交互。我们内部复现过类似思路，发现对于小样本场景（比如只有10个已知结构），这种策略能比直接跑Transformer收敛快5-10倍。但代价是训练成本极高，一次全量训练需要至少512张A100跑两周，普通实验室根本玩不起。所以Chai-3的优势本质上是用算力换数据，这对行业巨头是利好，但对中小团队可能还是门槛。

你提到的“可解释性被低估”，这个我深有感触。在抗体设计这种高风险场景里，模型输出一个结构，你很难判断它哪里是对的哪里是幻觉。我们吃过亏：有一次用Chai-3筛选出一个看起来完美的候选，CDR loop形状跟抗原完全互补，但送去做SPR测定时发现根本不解离，后来用Rosetta的interface analyzer一查，发现Chai-3生成的结构里有一个疏水残基暴露在溶剂中，导致整个构象其实不稳定。这个残基在Chai-3的score里只有0.2的惩罚，但在真实环境下是致命缺陷。所以我现在团队里的流程是：Chai-3出初始结构 => 用Rosetta做能量优化和sidechain packing => 再用MD跑10ns看稳定性。虽然流程变长了，但中间每一步都能给出物理可解释的指标，比如“这个氢键距离2.8埃，能量贡献-1.2kcal/mol”，这样跟实验组沟通时才能说清“为什么选这个不选那个”。可解释性不是锦上添花，是工业落地的底线。

至于会不会倒逼Rosetta转型，我觉得是“互相倒逼”。Rosetta的强项在于基于物理的能量函数和可解释性，它不会死，但它的角色会从“主力选手”变成“验证工具”。我预测未来两年会出现混合工作流：用Chai-3做高通量生成和粗筛，用Rosetta做精确打分和优化，最后用MD做动态验证。这其实已经在发生了，比如David Baker团队最近的工作就是拿扩散模型生成骨架，再用Rosetta进行序列设计，两者互补得很好。短期看，数据驱动模型不可能完全取代物理模型，因为抗体设计里还有太多反直觉的约束（比如免疫原性、表达量、聚集倾向），这些目前没有足够大的标注数据集来训练一个端到端模型。长期看，当Chai-3这类模型能同时预测表达量和稳定性时，Rosetta才可能真正退居二线。但以现在AI对蛋白质性质的理解深度，我保守估计至少需要5-10年。

最后说两句实操建议。如果你正在用Chai-3做项目，建议你关注以下几点：第一，不要只看RMSD，一定要看界面残基的局部置信度（Chai-3输出里有个pLDDT, interface variant），低于0.7的区域强烈建议用Rosetta重做；第二，对于CDR-H3长度超过15个残基的抗体，Chai-3的精度会显著下降，因为长loop的构象空间太大，模型容易过拟合到训练集里的少数模式；第三，如果你要优化表达量，别指望AI直接给出答案，可以用Chai-3快速生成一批候选，然后跑一个简单的“疏水补丁评估”，把表面暴露的疏水残基数量作为负指标，这能帮你筛掉大约30%后期可能出问题的候选。我们团队用这个方法，把从筛选到表达验证的周期从平均4个月压缩到了2.5个月，虽然离百倍还有距离，但已经是实际能落地的提升。

总的来说，Chai-3的百倍提升是真实的，但它是在一个狭窄而关键的维度（结构预测效率）上的突破。对于真实药物研发周期，它的作用是“把早期筛选的瓶颈从计算变成验证”，而不是直接缩短整个流程。你现在最应该做的，不是纠结100倍对不对，而是尽快把它整合到你的现有工具链里，同时保持对传统方法的信任。毕竟，等哪天AI能告诉你“这个抗体在仓鼠细胞里能表达且不聚集”时，我们才算真正毕业。

R Roy-71 L1

21楼 6天前

我也一直对那个“100倍”有点将信将疑，毕竟这类模型宣发经常玩数字游戏。你提到的数据稀疏性确实是老问题，之前做抗原表位预测时，稍微换一个靶点，模型就崩得厉害。Chai-3要是真能在小样本场景下稳定输出，那确实牛。

不过我倒是有个更实操的疑问：你测过它在非对称抗体结构上的表现吗？比如那种双特异性抗体或者纳米抗体，很多模型在对称性假设上容易翻车。另外你说的可开发性问题，我特别认同，表达量、稳定性这些才是真正卡脖子的地方。之前有个项目，模型预测的亲和力数据漂亮得很，结果

实际表达量只有2mg/L，根本没法推进。

我比较好奇的是，Chai-3有没有公开过具体的泛化测试？比如在CDR区随机突变的数据集上，跟Rosetta或者AlphaFold-Multimer比到底差多少？毕竟“百倍提升”要是只在某几个特定PDB条目上刷分，那产业界合作可能是看中他们团队之前的积累，而不是这个版本本身。另外，你有试过它的反向设计功能吗？就是给定一个抗原，让它直接生成候选抗体序列，那个流程的收敛速度怎么样？我手头有个很棘手的膜蛋白靶点，正愁没工具做初筛。

1 2 下一页

Chai-3百倍提升是噱头？实测抗体设计真香

全部回复

Prompt 专区

热门帖子

Max·凤的其他帖子

Chai-3百倍提升是噱头？实测抗体设计真香

全部回复

Prompt 专区

热门帖子

Max·凤 的其他帖子

Max·凤的其他帖子