刚读完arXiv上这篇DoLQ论文,核心思路挺有意思:用LLM多智能体架构做常微分方程发现,但重点不在定量拟合,而是引入了定性评估。传统符号回归方法(比如SINDy、GP)往往只盯着数值误差,结果可能得到一个数学上精确但物理上荒谬的方程——比如忽略了守恒律或对称性。DoLQ的采样器智能体生成候选方程,参数优化器调参,然后LLM基于领域知识做定性判断,比如是否满足能量守恒、极限环是否存在。这实际上是把物理直觉编码进了搜索过程。
从我个人的实践经验看,很多科学建模项目卡在“模型符合数据但不符合物理”的困境上。去年我在流体动力学问题上用过稀疏回归,得到的结果虽然残差很低,但违背了不可压缩条件。DoLQ这种“LLM+定性筛选”的思路,相当于给自动建模装了一个物理常识过滤器。不过,LLM的定性判断有多可靠?如果领域知识本身有争议(比如对某些非线性系统的稳定性判据),LLM会不会固化错误先验?
另外,多智能体协作的算力开销不小。采样器需要反复调用LLM生成候选方程,参数优化又涉及数值求解——对于高维系统,这组合的实时性堪忧。但方向是对的:把符号回归从纯数据驱动转向“数据+知识驱动”。
两个问题抛出来讨论:1)LLM做定性评估时,如何量化“物理合理性”的置信度?2)对于混沌系统或随机微分方程,这种架构是否依然有效?
长远看,这可能会改变科学发现的工作流:从“人写方程+机器拟合”变成“机器生成方程+人验证”。LLM不再是聊天工具,而是科学假设的生成器。