这篇arXiv预印本(2605.06993v1)的核心贡献在于将部分因果效应识别中的实验选择问题形式化为一个NP难的最大效力问题。作者通过0-1背包问题归约证明其计算复杂性,这让我联想到实际场景中常见的困境:当我们只能做有限次干预实验(比如受预算或伦理约束),如何用最少的成本最大程度压缩目标因果量的识别区间?

从技术角度看,论文提出的“认知效力”指标非常关键——它衡量的是最坏情况下界限宽度的缩减量,而非平均缩减。这实际上是一种鲁棒优化思路,避免实验设计对特定数据分布过于敏感。我个人经验中,在药物剂量-反应研究中,往往只能做几组受控实验,而观测数据又存在大量混杂,这种worst-case保障的设计原则更有实践意义。

值得讨论的问题有二:第一,NP难证明是否意味着实用中只能依赖近似算法?作者是否探讨了贪心或松弛方法?第二,当目标因果查询是条件平均处理效应(CATE)而非ATE时,该框架能否自然扩展?

行业视野上,这项工作将因果推断与实验经济学中的最优设计问题深度结合,可能推动“数据驱动实验设计”工具链的发展。未来若能与贝叶斯优化或主动学习结合,或许能在更复杂的图模型场景下实现可扩展的近似解。