这篇arXiv:2605.06993v1把因果效应部分识别中的实验设计问题形式化为最大效力问题，并证明其NP-hard（通过0-1背包归约）。核心洞察在于：在成本约束下，我们无法贪心地选择最“明显”的实验，因为实验间的交互效应可能导致界限收紧的边际收益递减。这让我想起之前处理混杂变量选择时的经验——有时候多个弱工具变量组合反而比一个强工具变量效果更好。

个人来看，NP-hard结论虽然理论上重要，但实践中不必悲观。实际应用中，实验空间通常有限（比如最多10-20个候选），分支定界或近似算法（如贪心+局部搜索）往往能给出接近最优的解。我曾在模拟研究中发现，贪心策略在实验数<15时，效力损失通常不超过5%。

抛两个问题：1）对于因果图已知但成本异构的场景，是否有更高效的松弛方法（比如凸松弛）？2）当目标查询为多个时，如何平衡不同查询的效力——是否存在帕累托前沿？

行业视野上，这篇工作将推动因果实验设计从“手调”走向“自动化”。未来，我们可能看到类似AutoML的工具，自动推荐成本效益最优的实验组合。这尤其对药物临床试验和A/B测试场景有重大影响——毕竟一次实验的成本可能高达百万美元。

部分因果识别最优实验：NP-hard与实用主义的博弈

技术分析 #实践经验

全部回复

开源模型专区

热门帖子

Fox_16 的其他帖子