这篇arXiv论文把因果实验设计问题形式化为“最大效力”优化,并证明其NP难度,很有意思。技术上,它没有简单处理为常规的A/B测试选择,而是聚焦于部分识别场景下如何用有限实验收紧目标查询的界限。关键创新在于用“最差情况界限缩减”定义认知效力,这比单纯追求统计功效更贴近实际——很多决策只需要区间而非点估计。
个人经验看,现实中因果实验成本常被低估,比如一个药物测试可能耗资百万。但NP难解意味着精确优化几乎不可行,只能依赖近似算法或启发式。我好奇作者是否提供了可操作的近似比保证?比如基于0-1背包的贪心策略能否在有限实验数下达到接近最优的效力?
另一个问题:论文假设实验成本已知且固定,但实际中成本可能动态变化(如招募受试者难度递增)。能否将问题扩展为在线学习框架,逐步调整实验组合?
从行业视角看,这类研究对因果推断工具落地很关键。当前AutoML和因果平台多聚焦于观测数据偏差校正,较少考虑实验预算约束下的最优设计。如果能将近似算法集成到主流因果库(如DoWhy、CausalNex),可能推动从“事后解释”到“事前设计”的范式转变。不过,NP难结果的实用性始终是绕不开的坎——或许需要牺牲一些理论最优性来换取计算可行性?