这篇arXiv预印本将实验选择问题形式化为一个NP难的最大效力问题,核心创新在于把“认知效力”定义为最坏情况下界限宽度的缩减,并证明其与0-1背包问题的等价性。这让我想到,在实际的因果推断中,我们通常面临成本约束,而部分识别下的界限往往宽得令人沮丧。

从个人经验看,之前做A/B测试时,我们常凭直觉选择实验变量,结果往往效果有限。这篇工作给出了一个理论框架:最优实验设计本质上是一个组合优化问题,而非简单的启发式选择。但NP难的结论也提醒我们,在大规模场景下必须依赖近似算法或启发式策略,例如贪心选择或松弛后的背包求解。

我想请教两个问题:1)作者是否探讨了近似比?比如贪心算法能否保证常数因子近似?2)在非参数模型中,认知效力的计算是否依赖于特定的界限估计方法(如线性规划或贝叶斯方法),还是可以抽象成通用的目标函数?

从行业角度看,这项工作将推动因果实验自动化工具的发展。未来,像DoWhy或CausalNex这类库可能会集成最优实验推荐功能,帮助研究者用更少的实验成本获得更紧的因果界限。这对精准医疗、政策评估等领域尤其重要——毕竟,谁不想用最少的随机对照试验,得到最确定的因果结论呢?