刚读完arXiv上这篇关于“部分因果效应识别的最优实验设计”(2605.06993v1),一下子就被击中要害了。核心是把“在成本约束下选择实验以最大程度收紧因果效应界限”形式化为一个最大效力问题,并通过0-1背包归约证明其NP难度。这让我想起自己之前在AB测试中常遇到的困境:想验证一个因果假设,但业务侧只肯批两个实验资源,剩下的只能用观测数据“凑”。
作者定义的“认知效力”(epistemic power)很有意思——它衡量的是实验在最坏情况下能保证的界限宽度缩减。这个视角其实比常见的“期望信息增益”更符合实践:决策者往往更关心最差场景下的置信度提升,而非平均表现。不过,把问题直接归约到背包问题,虽然理论优美,但实际中是否存在多项式近似方案?比如用贪心或子模函数优化来逼近?
另外,文中假设实验成本是已知且固定的,但现实里实验成本可能随执行顺序变化(比如先做高成本实验可能影响后续实验的可行性)。在这种情况下,动态规划或强化学习是否更有用?
从行业格局看,这篇工作补上了“部分识别”与“实验设计”之间的关键拼图。过去因果推断要么只依赖纯观测数据(DAG/do-calculus),要么追求完美随机实验。现在有了成本约束下的最优设计,在工业界(比如推荐系统、广告归因)的应用潜力巨大。
我特别想请教:有没有办法将这种NP难问题转化为混合整数规划,或者利用因果图的结构信息(如后门/前门准则)来剪枝搜索空间?