退学博士用AI掀翻学术圈，打假门槛被技术彻底拉平

2026年的春夏之交，中国学术圈和文学圈接连经历了两场“地震”。震中之一，是B站UP主“耿同学讲故事”——一位生物医学退学博士，在36天内连续实名举报5位985高校院长级学者论文造假，被点名的无一例外都是手握“国家杰出青年科学基金”和“长江学者”头衔的资深学者。另一场震中，是普通网友“抒情的森林”，从2024年10月开始，他用逐字逐句的文本对比，一年多时间内点名了近40位作家涉嫌抄袭，从86岁的杨本芬到贾平凹、贾浅浅父女，覆盖文坛老中青三代。两个普通人，一个靠AI工具，一个靠肉眼和查重软件，正在撼动两个领域的权威。

耿同学的操作方法被技术圈拆解后，核心流程只有三步：将论文PDF拆成文本、表格和图片，再交给AI做审查。他重点检查三个地方：数据末位数字分布是否过于集中（真实实验数据因测量误差呈随机分布，造假数据常出现大量“5”或“0”）；不同量表之间的数据是否有雷同（如基因表达量与肿瘤体积数据序列出现完全相同数值）；用视觉大模型检查图片是否被篡改或重复使用。在揭露中山大学邝栋明的论文造假时，耿同学一针见血：“这不仅是学术界的耻辱，更是造假界的耻辱。连随机数生成器都不会用的人，也配学术造假？”数据造假被发现，根本原因往往不是造假者技术太差，而是太敷衍——中山大学康铁邦的论文图片被形容为“从不同论文里直接复制粘贴”，上海大学苏佳灿的数据呈等差数列，同济大学王平的Nature论文中196只小鼠体重数据出现一只末位为“0”的离群值。耿同学直言：“编造者甚至没有花心思去做一组随机数据。如果用心去编，其实我是看不出来的。”

这场风暴最令人深思的地方，不是耿同学有多厉害，而是他的方法门槛极低。过往学术打假需要同领域学者、学术影响力或揭露问题的勇气，普通人连Nature文章都未必读懂，更别提找出数据造假痕迹。耿同学把学术争议降维成了数据判断题——不讨论高深生物学机制，只问：这组数据末位分布符合统计学规律吗？这两张图片相似度多少？这组数据有没有在其他表格中出现过？这些都是算法可以回答的，答案只有“是”或“否”，没有灰色地带。这套打法已成为可复制的工具，任何有心人都能尝试。而“抒情的森林”的故事则是第二版本——他用最基础的文本比对，只呈现事实，将判断交给读者，同样印证了技术正把监督权从中心推向边缘。

更深层的问题是，当一个体系需要靠退学博士来纠错时，改进方向何在？耿同学的方法论揭示了一个残酷事实：造假者在AI工具面前几乎无所遁形，但学术评价体系依然依赖“熟人社会”和信任评审。未来，学术期刊和机构或许应主动引入AI查重机制，将数据验证纳入审稿流程，而非等待外部举报。对于普通读者和从业者，耿同学的故事是一个提醒：技术工具已足够强大，监督不再是少数人的特权。学会使用这些工具，不仅是对学术诚信的捍卫，更是对自身判断力的赋能。当每一个会使用工具的人都能参与监督，造假成本将真正从“低成本、高回报”变为“高风险、零回报”。这或许就是AI时代最值得期待的变革。

退学博士用AI掀翻学术圈，打假门槛被技术彻底拉平

相关推荐

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首

苹果智能眼镜或复制手表策略，剑指2000亿眼镜市场

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首