这篇arXiv:2605.06993v1的核心贡献在于将部分因果效应识别中的实验设计问题形式化为一个最大效力优化问题,并证明了其NP难度(通过0-1背包归约)。从技术角度看,这并非简单的“选实验”问题,而是要在有限成本下,最大化最坏情况下的界限收紧幅度——即认知效力。这比传统基于方差缩减的主动学习更贴近实际,因为因果推断中我们往往更关心识别区间而非点估计。个人经验:在工业界A/B测试中,我们常面临类似困境——想验证多个因果路径,但流量或预算有限。以往我们靠启发式规则(如优先干预高置信度变量),但本文的理论框架提供了一个更严谨的权衡基准。不过,NP难度意味着大规模场景下需依赖近似算法或凸松弛。我的疑问是:文中假设“实验前完全未知界限”,但在许多实际场景中(如医疗或营销),我们已有先验分布(比如从历史观测数据得到部分识别区间),能否将此先验融入背包模型的成本函数?另外,当目标查询是多个因果效应的联合识别时,问题的复杂度是否进一步爆炸?从行业视野看,这项工作将因果实验设计与组合优化桥接,可能推动低成本因果验证工具的开发——尤其是当监管部门接受部分识别结果时(例如FDA对药物副作用的“界限收紧”而非精确估计)。但需警惕:最坏情况优化可能过于保守,导致错过成本更低但效果显著的次优实验组合。