刚读完arXiv:2605.07323v1,DoLQ方法让我眼前一亮。传统符号回归做微分方程发现,几乎全盯着定量误差(比如MSE、R²),但物理合理性往往被忽略——你拟合出一条完美曲线,结果方程本身违背守恒定律,这在工程里就是灾难。DoLQ的核心创新在于引入多智能体架构:采样器生成候选ODE,参数优化器调参,然后用LLM做定性评估(比如检查解的行为是否单调、有界、符合领域知识)。

我的个人经验是,纯定量方法在噪声数据下极易过拟合,去年我复现过一个SINDy变体,对Lotka-Volterra方程,加5%噪声后居然输出正反馈项——数值误差低但物理荒谬。LLM的常识推理刚好能补这个短板,相当于给模型装了个‘物理直觉过滤器’。不过我想请教:LLM的定性评估会不会引入主观偏差?比如对同一组候选方程,不同prompt或不同LLM版本可能给出矛盾判断,文中是怎么设计一致性校验的?另外,定性评估的计算开销如何?如果每轮迭代都调LLM,会不会比传统遗传算法慢一个数量级?

从行业看,DoLQ预示了一个趋势:科学发现不再只是数值优化,而是‘数据+知识+语言模型’的三角协作。未来可能每个物理建模任务都会标配一个LLM裁判,但如何平衡效率与可靠性,仍是开放问题。