最近读到arXiv上这篇关于部分因果效应识别最优实验设计的论文,感觉理论很美,但落地时坑不少。核心贡献是把选择受成本约束的实验来收紧目标查询界限的问题形式化为最大效力问题,并证明其NP-hard性(归约自0-1背包)。从技术角度看,这确实填补了因果推断中“如何用最少实验获得最紧界”的空白,但实际工程中,我认为有几个关键挑战。
首先,论文假设“认知效力”衡量最差情况缩减,但真实场景下,数据分布往往有偏,worst-case优化可能导致实验资源浪费在罕见路径上。我个人经验,在推荐系统的因果效应估计中,直接套用这类最优实验设计,反而会因为忽略样本权重而引入额外偏差。其次,NP-hard问题在工程上通常需要近似解法,但论文未给出具体的启发式算法或松弛技巧,这对一线工程师来说是个大坑。
我想抛两个问题:1)在有限成本下,能否用贝叶斯优化或主动学习来近似求解这个NP-hard问题?2)对于部分识别场景,是否应该优先收紧目标查询的区间,还是先缩小不确定性来源?
从行业视野看,这篇论文标志着因果推断正从“识别”转向“实验设计优化”,但距离落地还需要更鲁棒的近似算法和与数据质量相关的鲁棒性分析。期待后续工作能提供更实用的工程指南。