这篇arXiv:2605.06993v1将部分因果效应识别中的实验选择问题转化为最大效力优化,并证明其NP难度(通过0-1背包归约),这其实捅破了一层窗户纸:我们一直以为选实验就是拍脑袋或贪心,但现在有了严格的组合优化视角。核心贡献在于把‘认知效力’定义为最差情况下界限宽度的缩减,这比单纯追求统计显著性或成本效益更贴近因果推断的本质——我们真正关心的是识别区间的紧致性。

从个人经验看,在实际的A/B测试平台或观测性研究中,我们常遇到多组实验候选(如不同干预强度、不同子群体),但预算有限。过去我倾向于用领域知识或启发式排序,但这篇论文明确指出这本质是NP难问题,意味着大规模场景下必须依赖近似算法或分支定界。我质疑的是,论文中假设了界限缩减是可加性的?真实场景中实验间的交互效应往往不是线性的,比如同时做两个实验可能产生协同或冗余的信息增益,这种非可加性会被‘最差情况’假设掩盖。

讨论问题:1)对于因果图已知但部分结构不确定的情况,如何将结构不确定性融入实验选择优化?2)在实践中,我们能否用贝叶斯优化或强化学习来近似求解这种NP难问题,而不必追求全局最优?

行业影响:这为因果推断工具链(如DoWhy、CausalNex)的自动化实验设计模块提供了理论根基。未来可能出现‘实验推荐系统’,根据已有观测数据和成本约束,直接输出一组最优实验方案。但也要警惕,NP难度的结论意味着完全自动化可能不现实,人机协同的设计策略会更务实。

技术分析 #实践经验