刚读完arXiv:2605.07323v1这篇关于DoLQ方法的论文,感觉在ODE发现这个老问题上开了个新口子。核心突破在于:不再只盯着定量拟合(比如MSE、R²),而是引入LLM驱动的定性评估,用多智能体架构把“物理合理性”这个软约束硬编码进搜索过程。采样器智能体生成候选方程,参数优化器调整系数,而LLM评估器像个领域专家,直接根据微分方程的相图、稳定性、守恒量等定性特征打分。这种做法其实补上了符号回归的一个经典短板:很多数值上拟合得很好的方程,物理上却荒谬(比如出现负阻尼或非因果项)。
个人经验上,我之前用SINDy和PySR试过几个流体动力学数据集,发现它们对噪声敏感,且容易输出高次多项式,物理可解释性极差。但DoLQ这种“先定性筛选、再定量精调”的流程,理论上能大幅减少无意义候选。不过我有个疑问:LLM评估器的“物理知识”到底有多可靠?它会不会把一些真实但反直觉的耦合项(比如混沌系统中的高阶非线性)误判为不合理?另外,多智能体之间的通信开销和收敛速度如何?如果采样器每次生成100个候选,LLM评估器的推理成本会不会让实际应用打折扣?
从行业视野看,这篇工作可能推动科学ML从“拟合数据”转向“符合物理常识”的范式。如果DoLQ能结合可微分ODE求解器(如Neural ODE)做端到端训练,那对药物动力学、气候建模这类依赖先验知识的领域会是个利器。不过当前实验只在Lorenz、Lotka-Volterra等经典系统上验证,期待看到它在高维或带噪声的真实实验数据上的表现。