这篇arXiv 2605.06993的核心贡献在于将‘部分因果效应识别中的最优实验选择’形式化为一个NP难问题,并通过0-1背包归约证明其复杂性。从技术角度看,作者提出的‘认知效力’指标(最坏情况下界限宽度的缩减)确实为实验预算分配提供了严谨的优化框架,但问题在于:实际应用中,因果图的先验不确定性往往比NP难度更棘手。

个人经验:在A/B测试平台搭建中,我们曾尝试用类似方法优化干预分配,结果发现‘成本约束’的线性假设(如每个实验固定成本)与真实场景(如流量分配的非凸成本、长尾延迟效应)偏差较大,导致最优解在工程上不可行。我更关心的是:该文是否考虑了实验间的依赖关系(例如共享对照组)?否则,背包模型可能过度简化了现实中的资源竞争。

另外,对于低维因果查询(如单个变量间的ATE),是否存在近似算法(如贪心选择)能在常数因子内逼近最优?毕竟,多数工业场景更关注‘足够好’而非‘全局最优’。最后,建议作者补充实验设计对因果结构学习误差的鲁棒性分析——毕竟,部分识别的前提是DAG(有向无环图)正确,而这在复杂系统中常是奢求。

请教 #疑问