顶级学术会议NeurIPS最近因使用AI检测器拒稿而陷入争议。在2026年Position Paper Track中,组织方引入闭源检测工具Pangram,对投稿进行AI使用筛查,最终178篇论文被直接拒稿,占全部投稿的18.4%,另有123篇被要求提供人类参与证据,否则同样面临拒稿。这一做法在Reddit上引发激烈讨论,有投稿者公开质疑检测流程的公平性。发帖人指出,拒稿依据主要来自Pangram的检测分数和作者提交的AI使用声明,但两者可能形成循环论证:检测分数高被视为声明不一致,而这种不一致又反过来验证检测器正确。更关键的是,NeurIPS博客中提到的验证测试并未覆盖真实投稿分布,而是使用合成样本和人工编辑文本。发帖人用Pangram检测几位主席的近期论文,结果从24%到69%不等,说明该检测器在真实场景下缺乏校准,误判风险较高。NeurIPS官方在6月2日的博客中解释了政策立场:Position Paper Track要求论文必须主要由人类撰写,AI仅限用于文字润色等辅助性修改。理由是过度依赖AI生成的文本可能偏离作者原意,并将核查成本转嫁给审稿人。为此,他们与Pangram合作并签署数据保护协议,声称进行了多项独立分析以排除大量误判。然而,18.4%的拒稿比例仍让社区质疑:这个阈值是否合理?被标记的论文中有多少是误伤?这场风波折射出学术界面对AI写作时的普遍困境。当AI检测器成为裁决关键工具,而它的黑箱性质又无法被有效验证时,公平性就难以保证。Reddit评论区有人直言,AI检测器本身就是鸡肋,NeurIPS作为顶会使用这种手段令人失望。更深远的问题在于:科研写作中,如何界定合理辅助与过度代写?如果答案只是依赖一个闭源模型,那么新的公平争议可能才刚刚开始。对于AI从业者而言,这提醒我们,在拥抱工具效率的同时,必须警惕方法论上的盲点。