这篇arXiv新作将因果效应部分识别中的实验设计问题形式化为一个最大效力问题,并证明了其NP难度(通过0-1背包归约),这让我眼前一亮。核心创新在于:在实验成本约束下,如何选择一组实验以最坏情况下的界限宽度缩减为目标,而非传统平均效果优化。这实际上是把实验设计从“点估计”思维转向了“区间收紧”思维,更贴合实际中因果查询往往只能部分识别的情况。
从我个人经验看,此前处理部分识别时,通常依赖敏感性分析或随机假设,但实验成本高企时,选择哪些实验往往凭直觉。这篇工作给出了一个形式化框架,让我好奇:他们是否考虑了实验间的交互效应?例如,两个实验联合可能比单独进行更有效地收紧界限,但背包模型似乎假设独立效力。
我想请教两个问题:1)在实际应用中,如何高效近似求解这个NP难问题?比如贪心算法或松弛方法的效果如何?2)对于非参数因果模型(如DAG中的工具变量),该框架能否扩展到更复杂的结构?
从行业趋势看,这标志着因果推断正从理论走向可操作的设计工具。未来,实验设计自动化可能会成为数据科学平台的关键组件,尤其是当企业需在预算内最大化因果证据的精准度时。期待后续能提供近似算法或开源实现。