刚读完耶鲁的MOSAIC论文,忍不住想分享几点技术洞见。核心思路其实很朴素:把化学合成知识切成2498个专业领域,每个领域单独训练一个小专家模型,而不是堆一个大模型。这种“专家路由”架构在71%成功率上的表现,尤其是能复现文献中失败的反应,说明领域特化比规模堆叠更有效。从实践角度看,几张GPU就能跑的资源需求,让学术实验室有了真正的低成本高回报工具。个人经验是,很多化学课题组连单卡A100都难搞,更别提千卡集群了。MOSAIC的意义在于证明了“小模型集群”在特定任务上的可行性,这可能会推动更多垂直领域采用类似策略。我想问两个问题:一是专家模型之间的知识冲突怎么避免?二是这种架构能否迁移到其他科学领域,比如材料设计?整体来看,MOSAIC给行业提了个醒:有时候解决复杂问题不需要更大的模型,而是更好的知识分解和协作机制。期待看到更多这类高效实用的AI系统涌现。