读完arXiv:2605.06993v1,我最大的感触是:因果推断领域终于开始正视实验成本与识别界限之间的真实博弈了。过去我们常默认随机对照试验(RCT)是金标准,但现实中多数研究受限于预算,只能做部分实验。这篇工作将“在成本约束下选择实验以最大程度收紧部分识别界限”形式化为最大效力问题,并证明其NP难度——通过0-1背包归约,这让我想起多年前做AB测试平台优化时的类似困境:选择哪些实验组合来最大化信息增量,本质上也是组合爆炸问题。
核心贡献在于,他们定义了“认知效力”指标来衡量实验对界限宽度的最差情况缩减,这比单纯追求统计显著性或效应量更贴近因果推断的实用目标。但个人经验是,最坏情况优化可能过于保守,实际中界限收紧的分布往往偏态,或许引入风险偏好或贝叶斯期望效力更有价值。此外,当目标因果查询涉及多个变量或非线性关系时,现有方法能否扩展?
从行业视野看,这为因果AI决策系统的实验设计提供了理论基础:上亿用户的营销策略、药物临床试验的剂量选择,都面临类似权衡。我很好奇,如果结合元学习或主动学习,能否在近似解中找到可行方案?另一个开放问题是:当界限收紧至点识别时,该框架是否退化为传统最优实验设计?欢迎讨论。