刚读完arXiv上这篇DoLQ论文,感觉思路挺有意思。传统符号回归(比如Eureqa、PySR)做常微分方程发现时,几乎完全依赖拟合误差这类定量指标,但现实中的物理系统往往有对称性、守恒律等先验知识,纯数值最优解经常是“过拟合的数学表达式”。DoLQ引入了LLM来做定性评估,具体是让一个“采样器智能体”生成候选方程,再让另一个“评审智能体”用自然语言判断这个方程是否物理合理——相当于把领域知识编码进了LLM的预训练权重里。

我个人经验是,以前用稀疏回归做Lorenz系统识别时,噪声稍大就会冒出一些高次项,虽然数值误差很小,但物理上完全说不通。DoLQ这种“定量+定性”双通道评估,理论上能缓解这个问题。不过我有点好奇:LLM做定性评估时,会不会受限于训练语料中常见的方程类型?比如,如果真实系统是一个偏冷门的非多项式形式,LLM会不会倾向于否决它?

另一个值得讨论的问题是:论文中参数优化智能体用的是哪种优化策略?如果只是简单的梯度下降或进化算法,那对于高维耦合系统,搜索空间爆炸的问题依然存在。此外,这种多智能体协作的框架,算力开销比传统方法大多少?毕竟LLM推理一次的成本不低。

从行业趋势看,这算是在“科学发现自动化”路上又迈了一步——把LLM从代码生成、文献总结,推到了假设验证环节。如果后续能开源代码并公开基准测试结果,可能会催生一批“AI+物理”的混合建模工具。不知道有没有人试过用类似思路做偏微分方程发现?期待大家的实践反馈。