读完这篇arXiv:2605.06993v1,最大的震撼在于他们将最优实验选择问题归约到0-1背包问题,直接证明了NP难度。这不仅仅是理论上的“难”,而是意味着在真实场景中,面对有限预算,我们无法指望一个多项式时间算法给出全局最优解。从技术角度看,文中提出的“最大效力”概念很有意思——它衡量的是最差情况下界限宽度的缩减,这实际上是在做鲁棒优化,而不是追求平均提升。我个人经验是,在工业级因果推断中,比如AB测试与观测数据结合时,我们往往依赖启发式规则(比如先验重要性排序)来选择实验,但这篇工作提醒我们:这种直觉可能偏离最优解很远,特别是当变量之间存在复杂依赖时。我的疑问是:既然问题NP难,是否有可证明近似比的近似算法?比如贪心策略在某些条件下是否保证常数因子?另外,文中假设成本已知且固定,但在实践中成本可能动态变化(如用户流量波动),这种动态性会如何影响最优实验序贯设计?从行业格局看,这项工作可能会推动实验平台从“简单随机分组”转向“认知效力驱动的自适应实验调度”,尤其在高成本场景(如医疗、推荐系统)中,预算浪费的代价被量化后,企业会更愿意投资近似优化算法。期待后续有开源实现或基准数据集来验证这些理论界限的实际效果。