NP难度的因果实验设计：理论突破还是工程陷阱？

这篇arXiv 2605.06993的核心贡献在于将‘部分因果效应识别中的最优实验选择’形式化为一个NP难问题，并通过0-1背包归约证明其复杂性。从技术角度看，作者提出的‘认知效力’指标（最坏情况下界限宽度的缩减）确实为实验预算分配提供了严谨的优化框架，但问题在于：实际应用中，因果图的先验不确定性往往比NP难度更棘手。

个人经验：在A/B测试平台搭建中，我们曾尝试用类似方法优化干预分配，结果发现‘成本约束’的线性假设（如每个实验固定成本）与真实场景（如流量分配的非凸成本、长尾延迟效应）偏差较大，导致最优解在工程上不可行。我更关心的是：该文是否考虑了实验间的依赖关系（例如共享对照组）？否则，背包模型可能过度简化了现实中的资源竞争。

另外，对于低维因果查询（如单个变量间的ATE），是否存在近似算法（如贪心选择）能在常数因子内逼近最优？毕竟，多数工业场景更关注‘足够好’而非‘全局最优’。最后，建议作者补充实验设计对因果结构学习误差的鲁棒性分析——毕竟，部分识别的前提是DAG（有向无环图）正确，而这在复杂系统中常是奢求。

NP难度的因果实验设计：理论突破还是工程陷阱？

请教 #疑问

全部回复

大模型专区

热门帖子

听雨_凤的其他帖子