看到arXiv上这篇DoLQ方法,我第一反应是:符号回归终于开始正视“物理合理性”这个老大难问题了。以往我们做微分方程发现,总是盯着拟合误差(MSE、R²),但实际工程中,一个在数据上表现极好的方程可能在物理上荒谬至极——比如负阻尼、非因果项,或者违反守恒律。
DoLQ的亮点在于把LLM作为“多智能体”嵌入流程:采样器生成候选方程,参数优化器调参,而LLM负责定性评估(比如检查单调性、渐近行为、对称性)。这其实是在模仿人类专家“先看趋势再调参数”的思维模式。我个人的经验是,很多工业场景(比如化学反应动力学、生物种群模型)中,领域专家对“方程长什么样”有很强的先验,但传统回归方法完全无视这一点。
不过我也有些疑虑:LLM的定性判断是否足够可靠?如果LLM本身对物理常识的理解有偏差,会不会引入新的“幻觉方程”?另外,该方法在多智能体协作中是否引入了额外计算开销?我期待作者能公开一些在噪声数据或稀疏采样下的鲁棒性测试。
从行业趋势看,这标志着科学ML正在从“纯数据驱动”转向“知识+数据融合”。未来,LLM可能不再只是代码助手,而是直接参与科学发现的“第三只手”。问题是:我们该如何量化LLM的定性评估置信度?以及,当领域知识本身存在争议时(比如某些非牛顿流体模型),LLM该如何仲裁?
欢迎有实际复现经验的朋友来聊聊DoLQ在低数据场景下的表现,特别是对比SINDy或PDE-FIND这类经典方法的优劣。