2026年的春夏之交,中国学术圈和文学圈接连经历了两场“地震”。震中之一,是B站UP主“耿同学讲故事”——一位生物医学退学博士,在36天内连续实名举报5位985高校院长级学者论文造假,被点名的无一例外都是手握“国家杰出青年科学基金”和“长江学者”头衔的资深学者。另一场震中,是普通网友“抒情的森林”,从2024年10月开始,他用逐字逐句的文本对比,一年多时间内点名了近40位作家涉嫌抄袭,从86岁的杨本芬到贾平凹、贾浅浅父女,覆盖文坛老中青三代。两个普通人,一个靠AI工具,一个靠肉眼和查重软件,正在撼动两个领域的权威。
耿同学的操作方法被技术圈拆解后,核心流程只有三步:将论文PDF拆成文本、表格和图片,再交给AI做审查。他重点检查三个地方:数据末位数字分布是否过于集中(真实实验数据因测量误差呈随机分布,造假数据常出现大量“5”或“0”);不同量表之间的数据是否有雷同(如基因表达量与肿瘤体积数据序列出现完全相同数值);用视觉大模型检查图片是否被篡改或重复使用。在揭露中山大学邝栋明的论文造假时,耿同学一针见血:“这不仅是学术界的耻辱,更是造假界的耻辱。连随机数生成器都不会用的人,也配学术造假?”数据造假被发现,根本原因往往不是造假者技术太差,而是太敷衍——中山大学康铁邦的论文图片被形容为“从不同论文里直接复制粘贴”,上海大学苏佳灿的数据呈等差数列,同济大学王平的Nature论文中196只小鼠体重数据出现一只末位为“0”的离群值。耿同学直言:“编造者甚至没有花心思去做一组随机数据。如果用心去编,其实我是看不出来的。”
这场风暴最令人深思的地方,不是耿同学有多厉害,而是他的方法门槛极低。过往学术打假需要同领域学者、学术影响力或揭露问题的勇气,普通人连Nature文章都未必读懂,更别提找出数据造假痕迹。耿同学把学术争议降维成了数据判断题——不讨论高深生物学机制,只问:这组数据末位分布符合统计学规律吗?这两张图片相似度多少?这组数据有没有在其他表格中出现过?这些都是算法可以回答的,答案只有“是”或“否”,没有灰色地带。这套打法已成为可复制的工具,任何有心人都能尝试。而“抒情的森林”的故事则是第二版本——他用最基础的文本比对,只呈现事实,将判断交给读者,同样印证了技术正把监督权从中心推向边缘。
更深层的问题是,当一个体系需要靠退学博士来纠错时,改进方向何在?耿同学的方法论揭示了一个残酷事实:造假者在AI工具面前几乎无所遁形,但学术评价体系依然依赖“熟人社会”和信任评审。未来,学术期刊和机构或许应主动引入AI查重机制,将数据验证纳入审稿流程,而非等待外部举报。对于普通读者和从业者,耿同学的故事是一个提醒:技术工具已足够强大,监督不再是少数人的特权。学会使用这些工具,不仅是对学术诚信的捍卫,更是对自身判断力的赋能。当每一个会使用工具的人都能参与监督,造假成本将真正从“低成本、高回报”变为“高风险、零回报”。这或许就是AI时代最值得期待的变革。