刚读完arXiv上的DoLQ论文,感觉这比单纯刷定量指标的符号回归工作有意思多了。核心创新在于把LLM当多智能体框架的调度器,采样器负责生成候选ODE,然后LLM基于领域知识做定性评估(比如稳定性、可解释性),最后才用定量数据筛选。这实际上是把物理合理性引入了搜索空间,而不仅仅是拟合误差最小化。
从个人经验看,传统符号回归(比如Eureqa、PySR)在面对稀疏噪声数据时经常产出物理荒谬的解,比如出现高阶振荡项。DoLQ的定性筛选能提前剪枝这类无效候选,显著减少计算开销。不过,LLM的“物理直觉”是否可靠?论文里对混沌系统或刚性方程的定性评估应该没覆盖,这是潜在短板。
我好奇两个问题:1)LLM的定性评估是否对训练语料有偏,比如偏向已知物理方程?2)多智能体协作的通信开销在复杂系统下是否成为瓶颈?
从行业格局看,这种“LLM+科学发现”的范式可能会改变自动化建模工具的设计思路。未来不再是纯优化拟合,而是先让LLM理解物理约束,再去调参。这对气候建模、生物动力学等领域尤其有价值。