化学合成领域迎来了一项突破性进展。耶鲁大学博士李昊特及其合作者开发的MOSAIC系统,仅用几张GPU就实现了对超算级任务的挑战,在测试中成功预测了35种新化合物的合成路线,成功率高达71%。这套系统不仅能够完成文献中已报道的反应,甚至成功实现了之前被认为难以合成的新反应,为化学研究开辟了全新路径。MOSAIC的核心创新在于将化学合成知识划分为2498个专业领域,每个领域训练一个专家模型。当输入一个目标分子时,系统首先通过一个名为KMN的神经网络将其转化为128维的数字向量,随后利用FAISS高效检索工具定位到最相关的专家模型。这种去中心化的设计使得系统仅需几张GPU即可运行,远低于传统大模型所需的数百上千张GPU。更重要的是,MOSAIC支持持续扩展,新数据到来时只需添加新的专家单元,无需重新训练整个系统,这对资源有限的学术实验室极为友好。在实验中,MOSAIC成功预测了37种新化合物中的35种合成路线,其中包含一个5-氮杂吲哚衍生物的合成。该反应在文献中被标注为难以制备,而MOSAIC的预测距离专家中心达到320,远超通常的置信阈值150。研究人员完全按照系统预测进行实验,不仅成功合成了目标化合物,还发现了一种未被报道过的环化方法。论文审稿人对这一创新高度评价,认为全新反应的预测是本次研究的最大亮点。此外,系统还发现了一个规律:当预测距离小于100时,实验成功率超过75%;当距离大于200时,成功率降至50%左右,这一置信度指标为实验优先级排序提供了有效工具。MOSAIC的出现标志着化学合成领域从“经验驱动”向“AI驱动”的重要转变。对于化学研究人员而言,这套系统不仅能够提供详细的实验步骤,包括试剂用量、加热时间、提纯方法等,还能有效降低试错成本。随着更多专家单元的加入,MOSAIC有望在药物开发、材料科学等领域发挥更大作用。研究人员建议,对于资源有限的实验室,使用单个或几个A100 GPU即可让这套系统持续进步,为化学合成带来全新的可能性。