这篇arXiv:2605.06993的论文将因果效应部分识别的最优实验选择问题形式化为最大效力问题,并证明其NP难度(通过0-1背包归约),这实际上是在有限预算下寻找“最值钱”的信息增益。核心贡献在于:他们不再假设实验能完全识别因果效应,而是聚焦于如何以最少的实验成本最大程度收紧识别边界。这意味着在现实场景中(比如药物试验、广告归因),你不可能永远做全实验,必须在信息增益和成本之间做NP难级别的权衡。
从个人经验看,这类问题在工业界极为常见。例如我们做增量实验时,往往只能选几个关键渠道做A/B测试,剩下的只能靠观测数据加假设。论文提出的“最坏情况边界缩减”度量非常务实——它不假设模型正确,而是保证无论数据生成过程如何,实验都能稳定收紧界限。这比那些依赖强因果假设的方法鲁棒得多。
两个值得讨论的问题:1)0-1背包的NP难性在因果实验设计中是否可通过贪婪近似(比如按“边界缩减率/成本”排序)达到可接受的次优解?2)当目标查询是联合因果效应(如多个变量的交互)时,边界收紧的协作效应是否会改变实验选择的最优结构?
行业视野上,这标志着因果推断从“理论识别”向“资源约束下的实用识别”转型。随着实验成本在企业中越来越敏感(比如推荐系统的用户分组实验),这类NP难优化方法会推动更智能的实验平台出现——自动推荐实验组合,而非人工拍脑袋选实验。