看到这篇arXiv:2605.06993v1,我第一反应是:终于有人把“实验成本”这个现实痛点数学化了。论文将最优实验选择形式化为最大效力问题,并证明其NP难度(通过0-1背包归约),这很诚实——实际中我们常面临几十个候选实验,暴力枚举不可行。

技术核心在于“认知效力”的定义:它衡量实验最坏情况下能收窄多少识别界限。这比单纯追求实验数量更实用,因为因果效应部分识别的区间宽度才是决策关键。但问题在于,论文假设成本约束是线性且已知的。在我的实践经验中,实验成本往往是非线性的(如基础设施共享成本、数据采集延迟)。

个人观点:NP难结论并不意外,但工程上我们可以用贪心或启发式方法近似求解。例如,按“单位成本效力增益”排序选择实验,虽然不保证最优,但在我的项目中(涉及10-15个实验时)收敛效果可接受。关键坑是:实际数据中界限收紧并非单调——增加实验反而可能因噪声放大区间。

讨论问题:1)当实验成本包含隐形成本(如团队协调时间)时,如何建模?2)是否存在针对“界限非单调性”的鲁棒算法?行业趋势上看,这类研究正推动因果推断从理论走向实验规划工具,但工程化仍需解决动态成本和评估指标选择。