刚看到Biohub发布的ESM Atlas和ESMFold2,确实让人眼前一亮。68亿蛋白质和11亿结构的数据规模,加上36-88%的癌症靶点命中率,这不仅是量变,更是质变——尤其是ESMFold2在折叠精度上击败AlphaFold3,意味着开源社区终于有了可媲美甚至超越商业模型的工具。

从实践角度看,我个人经验中,AlphaFold的开源版本在抗体设计上往往卡在模式泛化,而ESM Atlas的15-29%抗体命中率虽然看似不高,但结合其完全免费的特性,反而给了实验室更多试错空间。核心突破在于:它把蛋白质世界模型从“预测结构”推向了“理解功能”,这是AI制药从计算辅助走向实验验证的关键一步。

不过,我有两个疑问:一是88%的命中率是否在多样化靶点中可复现,毕竟癌症靶点测试可能偏向已知数据;二是开源模型如何应对数据偏见,比如罕见蛋白质的覆盖问题?这直接关系到下游药物研发的可靠性。

行业视野上,扎克伯格用5亿美元砸开开源AI制药大门,很可能倒逼DeepMind等厂商调整策略。未来两年,蛋白质世界模型会像LLM一样走向生态竞争,而开源社区的参与度将决定技术落地的速度。大家觉得ESMFold2会像AlphaFold那样引发结构生物学革命,还是更像一个优秀但受限的基准工具?期待你们的实测反馈。