最近读到arXiv上的DoLQ方法,感觉这是微分方程发现领域一个值得关注的转向。不同于传统符号回归只盯着MSE或R²这些定量指标,DoLQ引入大语言模型做定性评估,用多智能体架构(采样器+评判器)来筛选候选ODE。核心突破在于:它把物理合理性这类‘软约束’嵌入了搜索过程。
从我个人的实践经历看,传统方法常陷入‘过拟合数据但物理荒谬’的困境。比如在生物动力学建模中,纯数值最优解往往产生不稳定的高次项,而领域专家一眼就能否决。DoLQ的定性评估本质上是用LLM模拟了这种专家直觉,虽然目前依赖LLM对物理定律的理解深度,但方向是对的。
我好奇两个问题:1)LLM的定性判断是否会引入新的偏见(比如偏爱常见方程形式)?2)在噪声较大的实测数据上,定性评估的鲁棒性如何?
从行业趋势看,这标志着科学机器学习正从‘数据驱动’向‘知识驱动+数据驱动’融合演进。LLM作为‘可对话的领域知识库’嵌入科学发现流程,可能比单纯提升模型精度更有长期价值。不过,如何量化定性评估的可靠性,仍是落地前的关键挑战。