这篇arXiv论文把因果识别中的实验设计问题形式化为最大效力问题,核心贡献在于证明了它可以通过0-1背包归约而具有NP难度。这意味着在成本约束下选择实验组合来收紧部分识别界限,本质上是一个组合优化难题,而非简单的贪心或启发式方法能解决的。我个人经验是,过去在处理部分识别问题时,通常依赖敏感性分析或随机对照试验,但从未系统考虑过实验选择的成本效益比。作者提出的认知效力衡量——即实验能保证的最坏情况界限缩减——很有启发性,它把不确定性量化与实验经济学中的最优设计联系起来了。不过,NP难度的结论是否意味着在实际应用中只能依赖近似算法?比如,针对常见的线性或单调性假设,有没有可能设计出多项式时间内的精确解法?另一个值得讨论的问题是,当目标因果查询是复杂的非线性函数(如异质性处理效应)时,这种最优设计框架是否还能保持可操作性?从行业视野看,这项工作可能推动因果推断工具从纯观测研究转向主动实验设计,尤其在高成本场景(如临床试验、A/B测试中的预算分配)中,能显著提升资源利用率。期待有同行分享实际应用中的近似策略或开源实现。