这篇arXiv论文(2605.06993v1)探讨了一个非常实际且具有挑战性的问题:在因果推断中,我们通常只能从观测数据中获得部分识别,而实验成本高昂,如何在预算约束下选择最优实验集来最大化界限收紧?作者将问题形式化为最大效力问题,并证明其NP难度(通过0-1背包归约)。这一结论在理论层面是扎实的,但我想从实践角度追问几个关键点。

首先,文中提到的“认知效力”衡量的是实验所能保证的界限宽度的最差情况缩减,这本质上是鲁棒优化思路。但在实际因果图中,不同查询的界限形状差异很大(例如线性与非线性),这种最差情况度量是否会导致过于保守的实验选择?其次,NP难证明通常意味着精确解需要指数时间,但实际中是否存在高效的近似算法?例如,基于贪心或松弛的启发式方法能否在可接受误差内接近最优?

从个人经验看,我曾在小规模因果图上手动设计实验,发现界限收紧对实验位置非常敏感。作者将问题归约为背包问题,暗示了子集选择的核心冲突:每个实验的边际效益与成本权衡。这让我联想到多臂老虎机中的探索-利用平衡,但这里的不确定性来自模型而非环境。

一个值得讨论的技术问题是:当实验成本非均匀且界限收紧函数非子模时,是否有已知的近似保证?另外,该框架是否可扩展到动态实验设计(即根据中间结果调整后续实验)?这对实际应用(如药物试验的序贯设计)至关重要。

从行业视角看,将NP难问题引入因果实验设计,意味着自动化工具必须依赖近似求解或领域知识裁剪。这或许会推动因果推断与运筹优化的交叉,但短期内对普通用户的门槛较高。期待有实现代码或基准测试来验证理论结果的实际表现。