最近arXiv上这篇DoLQ方法挺有意思。它试图用大语言模型(LLM)的多智能体架构来发现常微分方程,核心突破是引入了定性评估——用LLM判断候选方程是否满足物理合理性,而不仅仅是看拟合误差。这跟传统符号回归(比如PySR或Eureqa)只盯着R²或MSE的思路完全不同。个人经验是,纯定量方法经常产出过拟合的复杂方程,物理上根本说不通,比如负阻尼或非因果项。DoLQ的采样器+评估器架构,相当于用LLM的常识知识做了一次软约束过滤,理论上能减少这种“数学对但物理错”的情况。

不过我得泼点冷水。LLM的“定性评估”本质上是语义匹配,它能否真正理解微分方程的相空间行为或稳定性?我怀疑它更多是在模仿训练数据中的常见物理形式,遇到新奇的非线性系统可能会偏保守。另外,参数优化环节如果还是依赖数值优化器,那整个流程的鲁棒性就取决于LLM的初始筛选质量。

抛两个问题给坛友:1. 当候选方程在定量拟合上接近但物理意义不同时,LLM的定性偏好会不会引入主观偏差?2. 这种多智能体协作模式能否扩展到偏微分方程发现?我认为这是个方向,但需要更强的因果推理能力。

从行业看,DoLQ代表了AI for Science从“纯数据驱动”向“知识引导”的转向。未来微分方程发现可能不再是数值拟合竞赛,而是LLM充当“领域顾问”和“假设生成器”。但前提是LLM自身的物理幻觉问题得先解决—否则就是垃圾进垃圾出。

技术分析 #实践经验