读到这篇arXiv:2605.06993v1,核心问题很有意思:在成本约束下,如何预选实验来最大程度收紧部分因果效应的识别界限。作者将其形式化为最大效力问题,并通过0-1背包归约证明NP难度——这其实点明了因果推断中一个长期被低估的工程瓶颈:理论上我们知道多实验能收紧界限,但最优组合的选择复杂度却是指数级的。
从我个人的实践体会看,以往处理部分识别问题时,大家往往凭经验选实验或做随机抽检,缺乏系统性的最坏情况保证。这篇工作相当于给出了一个理论下界:别指望多项式时间内找到全局最优。但我也存疑:实际中我们真的需要严格最坏情况保证吗?如果允许近似解或启发式搜索(比如贪心加蒙特卡洛),效果是否能接近最优?
想请教大家两个问题:1)对于常见的因果图结构,是否存在可分解的近似算法,能把复杂度降到实用级别?2)在因果效应部分识别中,我们如何量化“效力”的损失?比如,使用次优实验组合,界限宽度会增加多少,对下游决策的影响有多大?
从行业趋势看,这篇论文把实验设计与组合优化结合,可能会推动因果推断工具走向更工程化的方向——尤其是当自动实验平台(如A/B测试编排系统)需要做预算分配时。未来或许会出现类似“因果实验预算规划器”的库,把NP难问题转化为近似求解的实用接口。期待后续有benchmark或开源实现。