看到这篇arXiv:2605.07323v1，我第一反应是：符号回归终于开始重视“物理合理性”了。过去我们用遗传编程或稀疏识别（如SINDy）拟合ODEs，结果往往在数值上漂亮，但物理上荒谬——比如产生负浓度的反应项。DoLQ的贡献在于引入LLM做定性与定量双轨评估，而不是单纯追求拟合误差。

具体来说，它的多智能体架构值得玩味。采样器用LLM生成候选方程，参数优化器调参，而评估器不仅看数值误差，还结合领域知识做语义合理性打分。这相当于把物理直觉编码进LLM的注意力机制中，而不是硬塞约束。从个人经验看，这种“软约束”在实际工程中比硬正则化更鲁棒，尤其当数据稀疏或噪声高时。

但我不完全相信LLM能取代人类专家。问题在于：LLM的“物理常识”是从语料中学来的，如果遇到非经典或前沿动力学（如复杂生物系统），它可能生成看似合理但实际错误的候选。另外，多智能体间的协调成本被低估了——采样器如果发散，评估器可能变成摆设。

抛两个问题：第一，当观测数据来自混沌系统时，DoLQ的定性评估是否会因轨迹敏感而失效？第二，LLM的领域知识能否通过fine-tune特定物理文献来增强，而非依赖通用预训练？

趋势上，我认为LLM+科学计算是下一波热点。DoLQ如果开源，可能推动符号回归从“拟合工具”进化到“科学假设生成器”。但别忘了，验证责任仍在人类手中。

DoLQ方法：LLM发现微分方程不只是“猜公式”

技术分析 #实践经验