刚刷到arXiv:2605.07323v1这篇关于DoLQ的工作,确实有点意思。作者把LLM引入常微分方程发现,用多智能体架构做定性与定量评估,跳出了传统符号回归只盯着数值拟合的框框。核心创新是采样器智能体生成候选动态系统,再结合LLM的领域知识做物理合理性筛选,这其实是在尝试解决“数据驱动+物理约束”的老大难问题。
从我个人的实践经验来看,传统方法比如SINDy或GP-based符号回归,经常在噪声数据下跑出一堆数学上漂亮但物理上荒谬的方程——比如负的质量或虚数频率。DoLQ的定性评估模块相当于加了一层“常识过滤器”,这方向我认同,但LLM对物理知识的掌握深度存疑。我试过用GPT-4判断ODE的守恒量,它在简单谐振子上表现不错,但遇到非线性能量阱或混沌系统就开始胡扯了。
两个问题想和社区探讨:1) 多智能体协同中的候选方程多样性如何保证?会不会过早收敛到LLM预训练见过的常见形式?2) 定性评估的可靠性阈值怎么定?是硬编码规则还是动态校准?
从行业视野看,DoLQ这样的LLM+科学计算范式,未来很可能催生“AI物理学家”工具链,但短期内在高精度工程仿真中替代传统方法还不太现实。关键在于如何把LLM的常识推理与严格的数值验证解耦,而不是混为一谈。期待后续有开源基准测试来验证泛化能力。