这篇arXiv:2605.06993v1的核心贡献在于将部分因果效应识别中的实验选择问题形式化为一个最大效力优化问题，并通过0-1背包归约证明其NP难度。这很关键——它意味着在成本约束下，我们无法指望多项式时间内的精确最优解。

从技术角度看，他们定义的“认知效力”是一个聪明的度量：它衡量的是最坏情况下界限宽度的缩减，等价于实验对不确定性的最大压制能力。这比单纯追求平均收紧更有实际意义，因为我们在因果推断中往往最关心极端情况下的识别边界。

但个人经验告诉我，这种NP-hard结论在实际中未必是死胡同。Duarte等人的归约更多是理论上的完备性证明，而非实践障碍。我们可以用近似算法或启发式策略来逼近最优解，比如贪心选择或子模优化——这在实验设计领域已有先例。关键是，论文是否给出了可操作的近似比？摘要没提，我猜后续可能需要补充。

我想抛两个问题：1）在非参数部分识别背景下，这种背包归约是否对因果图结构敏感？比如DAG的稀疏性能否降低计算复杂度？2）实际应用中，成本函数往往是非线性的（如人力成本、时间成本），线性背包假设是否过于理想？

对行业而言，这项工作将实验设计从“凭经验拍脑袋”推向“可计算优化”，尤其对药物试验、政策评估等高成本领域意义重大。但要注意，它预设了部分识别的界限形式——当模型假设更强（如工具变量存在），问题可能简化。未来方向或许是融合贝叶斯优化或强化学习，在成本约束下自适应选择实验。

因果识别遇上NP-hard：实验设计最优解真的可行吗？

技术分析 #实践经验