在刚刚落幕的CVPR 2026上,一份最佳学生论文荣誉提名引起了广泛关注。获奖论文ChordEdit来自广东工业大学的两名本科生——一作卢梁司和通讯作者Yang Shi。他们用一行核心公式,解决了当前一步式文生图模型在图像编辑中几乎无法使用的难题。更令人惊叹的是,这两名学生在半年内以第一作者或通讯作者身份,累计入选了5个顶级会议,横跨图像编辑、图神经网络、多模态推理和数据挖掘四个完全不同方向,堪称本科生科研的标杆案例。ChordEdit的核心创新在于将图像编辑重新定义为源分布和目标分布之间的最优传输问题。当前的一步式生成模型如SD-Turbo和SwiftBrush虽然生成速度快,但进行图像编辑时,由于多步推理被压缩为单步,路径粗糙导致画面崩坏、物体变形和背景混乱。现有训练自由的编辑方法如FlowEdit和Direct Inversion依赖多步推理来平均不稳定性,无法直接应用于一步模型。卢梁司的解法回溯到两个世纪的数学理论——从Monge在1781年提出的最优传输问题,到Benamou和Brenier在2000年给出的动态最优传输流体力学形式。ChordEdit通过将两个相邻时间点的漂移场差值做加权平均,得到一个低能量的Chord Control Field,相当于在时间维度上施加平滑算子,大幅降低方差和能量,使一步积分成为可能。整个方法的核心浓缩为一个等式(Eq. 4.5),无需训练、无需反演、无需额外掩码网络,论文33页中附录占了25页,全是数学证明,从能量收缩、误差界推到单步积分稳定性,逻辑严密。实验数据同样令人印象深刻。ChordEdit的全部实验在一块2018年发布的NVIDIA Titan 24GB显卡上完成,推理时显存占用仅7GB。消融实验可视化显示,朴素方法的编辑场能量高且不均匀,导致背景被摧毁和物体变形;而ChordEdit的编辑场能量低且平稳,非编辑区域几乎零扰动。这种低资源消耗和高鲁棒性,使该方法在实际部署中极具潜力。值得注意的是,卢梁司来自数学与统计学院的信息与计算科学专业,Yang Shi来自计算机学院,两人分别从数学和计算机视角切入,形成了高效互补的协作模式。这对本科生的成就不仅是个体能力的体现,更反映了当下科研环境的变化。在半年内,他们以一作或通讯作者身份在CVPR、ICML、KDD、ACL和WWW五个顶会发表论文,覆盖视觉生成、时空图建模、多模态推理和数据挖掘等领域。对于AI从业者和爱好者而言,ChordEdit展示了一条清晰的路径:当工程调参遇到瓶颈时,回归基础数学理论往往能带来突破性解决方案。展望未来,这种跨学科协作和理论驱动的创新模式,或许会成为年轻研究者快速成长的关键。对于正在寻找科研方向的本科生,这个故事也提供了一个重要启示:找到合适搭档,聚焦核心问题,扎实的理论功底和持续的产出能力,远比追逐热门方向更为重要。