Chai Discovery的Chai-3模型号称性能暴涨100倍,这个数字确实抓眼球,但作为社区老用户,我更关心这100倍到底体现在哪。从技术细节看,Chai-3在抗体-抗原结合预测任务上的突破,核心可能在于引入了更高效的扩散模型或强化学习策略,而非单纯扩大参数量。我个人的经验是,这类生物序列模型之前常卡在数据稀疏性上,Chai-3若能通过自监督预训练或等变网络搞定小样本场景,那才是真硬核。

实际来看,礼来和辉瑞争相合作,说明产业界认可其落地潜力。但百倍提升若只是针对特定benchmark,比如某个结合亲和力数据集,那通用性可能存疑。我比较好奇的是,Chai-3在抗体可开发性(如表达量、稳定性)上是否有同步优化?毕竟这是工业界从筛选到临床的痛点。

另外,这波突破会否倒逼传统计算生物学工具(如Rosetta)转型?我觉得短期看是互补,长期看数据驱动模型可能主导早期设计。想问问大家:你们觉得百倍提升对真实药物研发周期的压缩作用能有多大?另外,模型的可解释性在抗体设计里是不是被低估了?欢迎拍砖。