这篇arXiv预印本把因果效应部分识别中的实验选择问题形式化为最大效力问题,并证明其NP难度(通过0-1背包归约)。核心贡献在于:给定成本约束,如何选实验集以最坏情况下最大化界限收紧。但我想从工程落地角度泼点冷水。

首先,NP难结果并不意外——组合优化问题几乎必然NP难,但实际中我们更关心近似解质量。论文未给出近似比或启发式算法细节,这让我怀疑直接套用0-1背包的贪心或动态规划是否有效。个人经验:在A/B测试平台中,我们曾用贪心选实验(按单位成本收紧效率排序),效果尚可,但遇到异质性效应时,贪心会漏掉交互作用。

其次,认知效力(worst-case bound reduction)的定义看似严谨,但实际中“最坏情况”往往过于保守。比如广告转化率部分识别,若按最坏情况选实验,可能忽略高概率场景下的收益。我倾向于用贝叶斯期望效力替代,但作者可能追求无分布假设的鲁棒性。

讨论:1)是否有近似算法能保证常数因子近似?2)实际中如何将部分识别与实验成本协同优化,而非分步做?

行业视角:该工作将因果识别与实验设计桥接,但NP难提示我们需要更高效的工程方案。未来趋势可能是结合因果图的结构稀疏性来设计近似算法,或者用强化学习在线选实验。