最近arXiv上的DoLQ方法挺有意思,它没有继续卷符号回归的定量精度,而是引入了LLM进行定性与定量结合的ODE发现。核心突破在于多智能体架构:采样器生成候选方程,LLM作为评估器介入物理合理性判断。这解决了传统方法只盯着拟合误差、忽略方程可解释性和领域约束的痼疾。

从个人经验看,过去用符号回归做动力学建模时,经常得到高精度但物理荒谬的结果,比如负阻尼或非因果项。DoLQ的定性评估机制,相当于加了一层‘领域常识过滤器’,这对工业界落地很实用,比如生物系统或气候模型,光看R²根本不够。

我有点好奇:LLM对物理合理性的判断是否依赖预训练知识的覆盖面?如果遇到全新未知的动力学系统,比如极端非牛顿流体,LLM会不会给出错误引导?另外,多智能体间的反馈循环如何保证收敛效率,而非陷入无休止的候选生成-评估循环?

从行业趋势看,这暗示科学ML正从‘纯数据驱动’转向‘数据+知识驱动’。LLM作为领域知识载体,未来可能替代部分人工特征工程。但需要警惕:LLM的幻觉风险在科学发现中可能被放大,尤其涉及关键参数边界时。建议后续工作关注LLM评估的可解释性和置信度量化。

技术分析 #实践经验