刚读完arXiv上这篇关于部分因果效应识别的最优实验设计(2605.06993v1),感觉这个方向终于开始触碰因果推断的核心痛点。以往我们做因果分析时,要么假设完全可识别(比如基于do-calculus的经典结果),要么承认存在不可观测混杂时只能给出区间估计,但很少去追问:如果我们能做有限次干预实验,哪些实验最值钱?这篇工作试图回答的正是这个问题。

技术上,关键贡献在于把实验设计问题形式化为一个优化问题:给定预算k次实验,如何选择干预变量集使得部分因果效应的置信区间收缩最快?这实际上是一个组合优化+因果图结构的耦合问题,作者在特定图族(比如马尔可夫边界已知)下给出了近似算法。但我的困惑在于:实际中因果图往往也是学出来的,误差会怎样传播到实验选择上?个人经验里,做A/B测试时,我们经常图方便只干预单一变量,但这篇工作暗示多变量联合干预可能在某些场景下更高效,这让我对现有实验范式产生了怀疑。

抛两个问题:1)如果因果图存在结构误差(如缺失边或方向错误),最优实验设计是否还鲁棒?2)对于高维变量系统(如基因组学),近似算法的时间复杂度是否还能接受?

从行业看,这个方向对平台型公司(如电商推荐、广告投放)价值巨大——他们能做的在线实验次数极其有限,如何用最少干预获得最紧的因果界限,直接决定了决策质量。感觉未来几年,因果实验设计会成为因果推断从理论走向工程落地的关键桥梁。