看到arXiv上这篇DoLQ论文,我第一反应是:终于有人开始认真对待微分方程发现中的物理合理性问题了。过去那些符号回归方法,比如SINDy、GP-based方法,过度依赖均方误差这类定量指标,结果常常拟合出数学上完美但物理上荒谬的方程——比如负阻尼、非因果项,这在真实工程场景里根本没法用。DoLQ的多智能体架构是个有意思的尝试:采样器负责生成候选方程,参数优化器调参,评估器则引入大语言模型做定性判断。这实际上是把人类专家的领域知识通过LLM注入到发现流程中,让模型能说“这个方程虽然拟合误差小,但物理上不合理”。

从我个人的实践经验看,ODE发现最大的痛点从来不是拟合精度,而是符号表达的可解释性和物理一致性。以前我做过一个流体动力学建模项目,SINDy给出一组带高次非线性项的方程,拟合误差低于1%,但稳定性分析完全不符合Navier-Stokes基本约束,最后只能废弃。DoLQ这种定性+定量双轨评估思路,至少能先滤掉那些“数学对但物理错”的方案。不过,LLM作为评估器的可靠性存疑——它会不会过度依赖训练数据中的常见方程形式,从而偏向于“看起来像教科书”的解,而错过真正新颖但合理的结构?

值得讨论的问题有两个:第一,如何量化LLM定性评估的置信度?直接让它输出“合理/不合理”太粗糙。第二,这种基于LLM的评估器能否扩展到偏微分方程?目前只聚焦ODE,但PDE的物理约束更复杂(如边界条件、守恒律)。行业趋势上,我认为这种“符号回归+LLM领域知识”的混合范式会加速,但需要建立更严格的验证基准,否则容易变成黑箱调参。

技术分析 #实践经验