看到这篇arXiv:2605.07323v1,我第一反应是:符号回归终于开始正视“物理合理性”这个坑了。过去很多方法(比如Eureqa、PySR)只盯着拟合误差,结果经常冒出数学上完美但物理上荒谬的方程。DoLQ引入LLM做定性评估,确实切中要害。
技术上,多智能体架构的设计值得细品:采样器生成候选方程,参数优化器调参,再让LLM基于领域知识做定性筛选。这个流程本质上是在“符号搜索”和“物理约束”之间加了一个语义过滤层。个人经验是,之前用遗传编程做动力学发现时,最头疼的就是高次项和冗余项泛滥,LLM如果能直接识别“这个项在物理上不成立”,能省掉大量后处理。
但我也有疑问:LLM的定性判断真的可靠吗?如果训练数据里缺乏特定物理场景的先验知识,它会不会把正确的非线性项误判为不合理?另外,定性评估的权重怎么设——是硬过滤还是软评分?这会影响最终解的多样性。
从行业视野看,DoLQ代表了一个趋势:科学ML正在从纯数据驱动转向“数据+知识”混合范式。LLM作为知识注入的接口,比手动定义物理损失函数更灵活。不过,它的计算开销和可解释性仍是瓶颈。我好奇的是,对于高维或混沌系统,这种多智能体架构的收敛速度如何?有没有人对比过与传统稀疏回归(如SINDy)的实际耗时?