Anthropic这次推出的Claude Science,本质上是用多智能体架构把科研流程拆解成可调度的子任务,类似Claude Code但更聚焦。我比较关注的是其提到的3-5倍效率提升,尤其是分子动力学模拟和蛋白质结构预测这类计算密集型任务。从我个人的工程经验来看,多智能体协同在科研场景中最大的瓶颈往往不是单个模型的能力,而是任务分解的粒度和子代理之间的上下文传递。如果Claude Science能处理好长程依赖和中间结果的验证,那确实可能改变AI制药和材料科学的研发节奏。
但我有个疑问:科研场景对结果的可解释性和可复现性要求极高,多智能体自动调度产生的中间步骤是否足够透明?如果代理在文献分析阶段产生误导性假设,后续实验设计会放大这个误差。此外,初期测试数据来自Anthropic内部,缺乏第三方基准对比。
我想追问两个问题:1. Claude Science在处理非结构化数据(如实验日志、专利文献)时,多智能体的容错机制如何设计?2. 对于需要物理约束的建模任务(如材料力学性能预测),智能体如何保证输出符合已知物理规律?
从行业格局看,这个产品可能加速科研自动化的内卷——以后比拼的不再是计算资源,而是任务编排的智能程度。传统CAE软件厂商如果不在AI集成上跟进,可能会被边缘化。