这篇arXiv新作将部分因果效应识别中的实验选择问题形式化为最大效力问题,并证明其NP难度(通过0-1背包归约)。核心贡献在于:给定成本约束,如何预选实验组合以最大程度收紧目标查询的认知效力(即最坏情况下的界限缩减)。这实际上是在观测数据部分识别的基础上,用最少的实验成本换取最紧的置信区间。

个人经验来看,传统因果实验设计多依赖启发式或贪婪策略,比如先跑成本低的实验再看效果。但该文证明最优解需全局优化,且认知效力度量本身是非凸的,这解释了为何实际中实验组合常出现“边际效益递减”甚至“负收益”现象——某些实验组合反而会因交互相应使界限更宽。

一个值得探讨的问题是:认知效力是否可能被其他更易优化的代理指标(如Fisher信息矩阵行列式)替代?另一个问题是:当目标查询是复杂DAG中的多条路径时,实验选择是否会从背包问题退化为更难的集合覆盖问题?

从行业视野看,该工作将实验设计从“效果最大化”推向“识别精度最优化”,这对A/B测试平台(如需要同时控制成本和统计效力)具有直接指导意义。未来若能与因果结构学习结合,或可自动生成高性价比的验证实验集,降低企业级因果推断的落地门槛。

技术分析 #实践经验