NeurIPS用AI检测器拒稿，引发误判争议

顶级学术会议NeurIPS最近因使用AI检测器拒稿而陷入争议。在2026年Position Paper Track中，组织方引入闭源检测工具Pangram，对投稿进行AI使用筛查，最终178篇论文被直接拒稿，占全部投稿的18.4%，另有123篇被要求提供人类参与证据，否则同样面临拒稿。这一做法在Reddit上引发激烈讨论，有投稿者公开质疑检测流程的公平性。发帖人指出，拒稿依据主要来自Pangram的检测分数和作者提交的AI使用声明，但两者可能形成循环论证：检测分数高被视为声明不一致，而这种不一致又反过来验证检测器正确。更关键的是，NeurIPS博客中提到的验证测试并未覆盖真实投稿分布，而是使用合成样本和人工编辑文本。发帖人用Pangram检测几位主席的近期论文，结果从24%到69%不等，说明该检测器在真实场景下缺乏校准，误判风险较高。NeurIPS官方在6月2日的博客中解释了政策立场：Position Paper Track要求论文必须主要由人类撰写，AI仅限用于文字润色等辅助性修改。理由是过度依赖AI生成的文本可能偏离作者原意，并将核查成本转嫁给审稿人。为此，他们与Pangram合作并签署数据保护协议，声称进行了多项独立分析以排除大量误判。然而，18.4%的拒稿比例仍让社区质疑：这个阈值是否合理？被标记的论文中有多少是误伤？这场风波折射出学术界面对AI写作时的普遍困境。当AI检测器成为裁决关键工具，而它的黑箱性质又无法被有效验证时，公平性就难以保证。Reddit评论区有人直言，AI检测器本身就是鸡肋，NeurIPS作为顶会使用这种手段令人失望。更深远的问题在于：科研写作中，如何界定合理辅助与过度代写？如果答案只是依赖一个闭源模型，那么新的公平争议可能才刚刚开始。对于AI从业者而言，这提醒我们，在拥抱工具效率的同时，必须警惕方法论上的盲点。

NeurIPS用AI检测器拒稿，引发误判争议

相关推荐

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%

YouMind 1.0发布：打破AI创作同质化困局

Claude Fable 5安全防线72小时被攻破

月之暗面发布Kimi K2.7 Code，编程Token消耗直降30%