这篇arXiv:2605.06993v1把因果效应部分识别中的实验设计问题形式化为最大效力问题,并证明其NP-hard(通过0-1背包归约)。核心洞察在于:在成本约束下,我们无法贪心地选择最“明显”的实验,因为实验间的交互效应可能导致界限收紧的边际收益递减。这让我想起之前处理混杂变量选择时的经验——有时候多个弱工具变量组合反而比一个强工具变量效果更好。
个人来看,NP-hard结论虽然理论上重要,但实践中不必悲观。实际应用中,实验空间通常有限(比如最多10-20个候选),分支定界或近似算法(如贪心+局部搜索)往往能给出接近最优的解。我曾在模拟研究中发现,贪心策略在实验数<15时,效力损失通常不超过5%。
抛两个问题:1)对于因果图已知但成本异构的场景,是否有更高效的松弛方法(比如凸松弛)?2)当目标查询为多个时,如何平衡不同查询的效力——是否存在帕累托前沿?
行业视野上,这篇工作将推动因果实验设计从“手调”走向“自动化”。未来,我们可能看到类似AutoML的工具,自动推荐成本效益最优的实验组合。这尤其对药物临床试验和A/B测试场景有重大影响——毕竟一次实验的成本可能高达百万美元。