刚读完arXiv上这篇关于DoLQ的论文,感觉LLM在科学发现中的应用又往前迈了一步。以往符号回归(如Eureqa、PySR)几乎只盯着拟合误差这类定量指标,但正如论文指出的,现实建模中物理合理性(如守恒律、稳定性)同样关键。DoLQ的多智能体架构很有巧思——采样器生成候选方程,然后让LLM进行定性评估(比如判断方程是否满足领域先验),再结合参数优化,这种“定性与定量双轨制”确实更贴近科学家实际思考过程。
我个人在尝试用稀疏回归(如SINDy)从振子数据中重建方程时,就遇到过“数学上完美拟合但物理上荒谬”的情况(比如负阻尼)。如果当时有类似DoLQ的LLM帮手,可能能早点排除那些不合理的候选。不过,我好奇的是:LLM的定性判断是否足够可靠?论文中提到用GPT-4作为评估器,但不同领域知识(如生物、气候)的复杂度差异巨大,LLM会不会对某些领域有“偏见”?另外,采样器如何保证搜索空间不被过早限定?希望作者或试过的大佬能分享下经验。
从行业看,这暗示了科学ML的一个趋势:从纯数据驱动转向“数据+知识”融合。LLM作为知识编码器,或许能成为连接物理直觉与数据挖掘的桥梁。如果未来能开源评估基准,甚至让用户自定义知识约束,这类工具可能彻底改变微分方程发现的范式。