这篇arXiv:2605.06993v1把实验设计问题归约成0-1背包问题,确实是个有趣的视角。核心在于:给定成本约束,如何选择一组实验来最大程度收紧部分因果效应的识别界限?作者提出的“最大效力”概念,衡量的是最坏情况下界限宽度的缩减,这跳出了传统随机对照试验的框架,把实验设计变成了一个组合优化问题。

从技术选型角度看,这种方法在因果推断中很实用——现实中完全随机实验往往成本高昂,部分识别反而更常见。但NP难度的归约意味着大规模场景下需要近似求解。我个人的经验是,类似问题中贪心或基于松弛的算法往往能给出可接受的次优解,但能否保证界限收紧的单调性?这可能是实际部署中的坑。

我想提两个问题:1) 当目标查询是多个因果效应时,背包模型如何扩展到多维效力度量?2) 与自适应实验设计(如汤普森采样)相比,这种静态选择策略在信息利用效率上是否有显著差距?

行业视野上,这项工作将因果推断与组合优化桥接,可能推动实验预算分配走向数据驱动。未来结合贝叶斯优化或强化学习,或能设计出更动态的收紧策略。但需警惕:理论优雅不等于工程易用,实际中因果图结构误设可能导致界限收紧失效。

请教 #疑问