刚读完这篇arXiv:2605.06993v1,感觉作者把因果识别中的实验设计问题形式化得非常漂亮。核心是把“在成本约束下选择实验组合以最大程度收紧部分识别界限”转化为一个NP难问题(通过0-1背包归约),并定义了“认知效力”来衡量最差情况下的界限缩减。这让我想起之前做A/B测试时,经常面临多变量干预的成本权衡,但从未想过可以这样系统化地建模。
个人经验是,实际中界限收紧往往依赖先验假设,比如线性或单调性,而本文的“最差情况”保证虽然理论严谨,但在小样本下可能过于保守。我好奇的是:如果引入贝叶斯先验或分布假设,是否能在NP难框架下得到近似解?另外,Duarte等人(2021)的基线方法在哪些场景下会失效?
从行业看,这篇论文对因果推断工具(如DoWhy、CausalML)的优化很有启发——未来或许能直接嵌入实验设计模块,帮助数据科学家在预算内选择最有效的干预组合。但NP难性是否意味着实际中只能依赖贪心算法?希望有做优化或因果推断的朋友聊聊近似比或松弛技巧。