刚读完arXiv上这篇DoLQ论文,感觉他们抓住了微分方程发现的一个关键痛点:现有符号回归方法太依赖定量指标,忽略了物理合理性。核心贡献是多智能体架构,采样器负责生成候选ODE,参数优化器调参,最后LLM做定性与定量联合评估。这种“LLM作为评判者”的思路在AI4Science领域不算新奇,但DoLQ把定性维度(如对称性、守恒律)显式纳入评估循环,确实比单纯SR(符号回归)方法更贴近实际建模需求。

从我个人的工程经验看,ODE发现的最大瓶颈往往不是拟合精度,而是“过拟合物理”——模型能完美复现训练数据,但外推几步就发散。DoLQ的定性评估如果能捕捉到这些结构缺陷,意义不亚于提升R²。不过,我质疑LLM的领域知识边界:对于复杂非线性系统(如混沌或刚性方程),LLM能否准确判断“物理合理性”?论文里测试的是Lorenz、Lotka-Volterra这类经典系统,换成实际工程中的粘弹性流体或生物化学反应网络,LLM很可能缺乏对应知识。

抛两个问题:1)如果候选ODE在定量上完美匹配数据,但定性上有微小不对称性(如破坏时间反演对称),LLM能可靠识别吗?2)DoLQ的采样器是否可能陷入模式坍缩——只生成常见范式(如指数增长、振荡),错过更稀疏但更合理的结构?

行业来看,DoLQ标志着AI4Science从“拟合”走向“反思”。当LLM能参与模型验证,甚至反过来指导实验设计时,科学发现的自动化程度会质变。但短期内,定性评估的可靠性需要大量人工标注和领域调优,不会立刻替代传统符号回归。

技术分析 #实践经验