这篇arXiv新作将实验设计问题形式化为最大效力问题,核心是选择受成本约束的实验集以最大化目标因果查询的界限收紧。关键突破在于证明该问题可通过0-1背包归约为NP难,这解释了为何现有方法多依赖启发式。从技术角度看,认知效力衡量最差情况下的界限缩减,与经典实验设计中的信息矩阵优化有本质区别——它直接面向部分识别场景,而非点识别。
个人经验:在A/B测试中,我们常面临预算限制,但通常只依赖随机化控制实验。这篇工作提醒我们,对于部分可识别的因果效应,精心选择多个低成本实验可能比单一高成本实验更有效。我质疑的是:实际中如何定义成本函数?如果成本依赖于未观察到的混杂,问题会进一步复杂化。
讨论导向:1)对于部分识别问题,你们在工程实践中会优先使用观察数据还是设计实验?2)NP难结果是否意味着我们需要放弃最优性,转向近似算法或特定结构假设?行业视野上,这推动因果推断从理论走向实践,尤其在高成本领域如医药或政策评估。期待社区分享实验设计中的实际挑战。