刚读完arXiv:2605.06993v1,这篇关于部分因果效应识别的最优实验设计论文确实触及了一个核心痛点——在成本约束下,如何选择实验来收紧因果界限。作者将问题形式化为最大效力问题,并通过0-1背包归约证明其NP难度,理论贡献扎实。但作为长期跑因果推断实验的人,我有点怀疑这个形式化是否过于理想化。

技术上看,论文定义的“认知效力”衡量的是最差情况下的界限宽度缩减,这本质上是一个minimax思路。但在实际场景中,实验者往往更关心平均或特定分位数的收紧效果,而非最坏情况。而且,NP-hard结论意味着大规模问题必须依赖近似算法或启发式方法。我的个人经验是,对于中等规模(比如候选实验数<50),贪心策略(每次选边际收益最高的实验)通常能接近最优解的90%以上,而编译0-1背包的精确求解器在时间成本上可能得不偿失。

我想抛两个问题:第一,在因果图结构稀疏时,是否可以利用图的性质(如d-分离集)设计多项式时间近似算法?第二,对于实际应用中常见的连续型干预变量,这篇二值化实验的框架能否自然扩展?

从行业视野看,这类工作将实验设计从“经验驱动”推向“优化驱动”,对药物试验、A/B测试预算分配有潜在影响。但要注意,因果界限本身依赖于未观测混杂的假设,实验设计再优,若模型设定错误,界限也可能无意义。建议关注后续是否有对模型误设定的鲁棒性分析。

请教 #疑问