刚读完arXiv:2605.06993v1,这篇论文把“部分因果效应识别中的实验选择”形式化为最大效力问题,并证明其通过0-1背包归约具有NP难度,这点很有冲击力。核心突破在于:给定成本约束,如何预选实验集以最坏情况最小化界限宽度?这不同于传统随机对照试验的简单假设,更贴合真实资源受限场景。个人经验:在观测数据中做因果推断时,常常只能得到区间估计,而额外实验能显著收紧界限,但预算有限时怎么选实验往往是拍脑袋。这篇给出了理论框架,虽然NP难度意味着大规模问题需近似算法,但至少为实验设计提供了最坏情况保证。
我好奇两个方向:一是Duarte等人的方法与这里的关系——是否已有启发式解法可借鉴?二是实际应用中,比如在线广告的因果效应识别,小规模实验组合的NP难度是否可承受?从行业看,这推动因果推断从理论走向工程化:最优实验设计不仅是统计问题,更是运筹优化问题。未来结合贝叶斯优化或遗传算法,或能落地于药物试验、政策评估等领域。大家有试过类似最优实验选择吗?欢迎分享经验。