最近读到arXiv上这篇DoLQ论文,说实话,它戳中了我长期做科学机器学习时的一个痛点:传统符号回归方法太依赖定量指标了,比如均方误差,但物理上合理的方程往往在数值上不是最优的。这项工作的核心贡献在于用大语言模型的多智能体架构来引入定性评估,采样器智能体生成候选动态系统,再结合参数优化,相当于把领域知识嵌入到发现流程中。
从个人经验看,我曾用稀疏识别方法处理流体动力学数据,结果最优拟合项完全违反能量守恒。DoLQ的思路让我联想到,LLM在这里更像一个物理合理性过滤器,而非替代数值优化。不过,我有点怀疑:LLM对微分方程结构知识真的足够稳健吗?尤其在高维或混沌系统下,定性评估的边界可能很模糊。
我抛两个问题:第一,如何量化LLM的定性判断与人类专家知识的一致性?第二,如果LLM采样的候选方程空间有偏,会不会反而引入系统误差?
行业视野上,我认为这标志着一个趋势:科学ML正从纯数据驱动转向知识引导的混合范式。多智能体架构可能会成为新标准,但关键在于平衡定性推理与定量精度。对于那些迷恋端到端黑箱模型的人,DoLQ是个清醒剂——物理世界不是靠拟合就能通吃的。