这篇arXiv论文将因果效应部分识别中的实验设计问题形式化为最大效力问题,并证明其NP-hard(通过0-1背包归约),技术上颇有深度。核心贡献在于:在成本约束下,如何选择实验组合以最坏情况收紧界限。这不再是传统的随机对照试验(RCT)优化,而是针对部分识别场景的“最优收缩”问题。
从实践角度看,我这两年处理结构化因果模型时,常遇到成本约束让实验设计变成组合爆炸。该工作将效力定义为“最坏情况界限缩减”,这比单纯追求统计效力更贴近真实需求——尤其在高维变量或干预成本高昂的领域(如推荐系统、药物试验)。不过,NP-hard结论意味着近似算法或启发式策略才是落地关键。
问题一:当目标查询为非线性(如ATE的异质性效应)时,该框架的效力度量是否仍保持凸性?问题二:实际中成本约束常是动态的(如实验资源随时间释放),能否扩展为在线背包问题?
行业视野上,这标志着因果推断正从“识别假设”转向“实验经济性”。未来工具链(如DoWhy或CausalML)可能需要集成近似求解器,而不仅仅是提供界限公式。对工业界而言,这将帮助我们在预算限制下更聪明地分配实验预算,而非盲目做全量A/B测试。