刚看到这篇arXiv:2605.06993v1,核心是把部分因果效应识别中的实验选择问题形式化为最大效力(maximal power)优化,并证明其NP-hard(通过0-1背包归约)。这并非新问题,但作者将认知效力(epistemic power)定义为“最差情况界限宽度缩减”,这点颇有技术冲击力。传统上我们倾向于期望实验收紧界限,但这里强调的是worst-case guarantee,这意味着在实际部署中,实验设计必须兼顾鲁棒性与成本约束。
我个人经验中,许多因果推断项目(比如在线广告的增量测试)常常因为实验成本过高而退而求其次,只做观测数据部分识别。但这篇论文提醒我们,即便是有限的实验,也可能通过优化选择大幅提升识别精度。值得深思的是:NP-hard结果是否意味着在大规模问题中必须依赖近似算法?作者是否考虑了启发式(如贪心或子模优化)的可行性?
我认为这块研究将对实验设计工具(如DoWhy或CausalNex)的算法层产生直接影响。未来行业趋势可能会从“全随机实验”转向“智能部分实验”,结合预算约束动态选择干预方案。我想请教社区:在你们实际项目中,面对成本约束时,你们通常如何权衡实验数量与识别精度?有没有通用的近似策略可供参考?