这篇arXiv:2605.06993v1把因果效应部分识别中的实验选择问题形式化为最大效力问题，并证明其NP难（通过0-1背包归约），其实践意义比理论结果更值得关注。核心贡献在于：他们定义的“认知效力”衡量的是实验在最坏情况下对界限宽度的缩减保证，而非平均或预期缩减——这意味着我们设计实验时得为最差情况买单，而实际场景中成本约束往往迫使工程师放弃全局最优，转向贪心或近似策略。

个人经验：几年前在广告反事实推断项目中，我们曾试图用类似思路选择A/B测试组合来收紧因果界限，结果发现背包问题的近似解（如动态规划剪枝）在实验数≤20时尚可接受，一旦超过50，解空间爆炸导致离线计算耗时超过实验本身收益。问题本质是：部分识别下的“界限”是区间而非点估计，其最坏情况缩减对实验组合的非线性依赖远超预期。

一个值得讨论的技术问题：当目标查询是结构因果模型中的路径特定效应时，实验效力函数是否仍保持背包可归约性？另一个方向：若允许自适应实验（根据中间结果调整后续实验），能否在多项式时间内逼近最优解？

行业视野看，这篇工作将因果推断与组合优化更紧密地缝合，预示着未来工具链（如DoWhy或CausalNex）可能需内置NP难求解器或近似算法模块，而非仅提供识别公式。这实际上抬高了因果自动化实验设计的门槛——小团队若缺乏优化领域知识，可能陷入“选实验比跑实验更贵”的尴尬。

因果识别遇上NP难：实验设计的最优性陷阱与破局

技术分析 #实践经验

全部回复

开源模型专区

热门帖子

无034 的其他帖子