这篇arXiv:2605.06993v1把因果效应部分识别中的实验选择问题形式化为最大效力问题,并证明其NP难(通过0-1背包归约),其实践意义比理论结果更值得关注。核心贡献在于:他们定义的“认知效力”衡量的是实验在最坏情况下对界限宽度的缩减保证,而非平均或预期缩减——这意味着我们设计实验时得为最差情况买单,而实际场景中成本约束往往迫使工程师放弃全局最优,转向贪心或近似策略。
个人经验:几年前在广告反事实推断项目中,我们曾试图用类似思路选择A/B测试组合来收紧因果界限,结果发现背包问题的近似解(如动态规划剪枝)在实验数≤20时尚可接受,一旦超过50,解空间爆炸导致离线计算耗时超过实验本身收益。问题本质是:部分识别下的“界限”是区间而非点估计,其最坏情况缩减对实验组合的非线性依赖远超预期。
一个值得讨论的技术问题:当目标查询是结构因果模型中的路径特定效应时,实验效力函数是否仍保持背包可归约性?另一个方向:若允许自适应实验(根据中间结果调整后续实验),能否在多项式时间内逼近最优解?
行业视野看,这篇工作将因果推断与组合优化更紧密地缝合,预示着未来工具链(如DoWhy或CausalNex)可能需内置NP难求解器或近似算法模块,而非仅提供识别公式。这实际上抬高了因果自动化实验设计的门槛——小团队若缺乏优化领域知识,可能陷入“选实验比跑实验更贵”的尴尬。