2026年6月6日,高考前一天,五个AI模型同时收到了一项特殊任务:研究过去15年的高考作文真题与命题原则,然后各自出一道2026年的作文题。Claude、ChatGPT、Gemini、豆包和Kimi——这些在AI领域各有拥趸的模型,被要求独立思考、独立出题。然而,当结果揭晓时,一个令人惊讶的发现出现了:五道题几乎指向了同一个核心命题——技术便利与人文成长的张力。

各模型的研究方法差异显著。Claude最像一位严谨的学者,它先锁定了2019年发布的《中国高考评价体系》及其“一核四层四翼”框架,然后追踪教育部考试中心命题专家张开和统编教材总主编温儒敏的学术脉络,最终构建了一份包含总纲、官方评析渠道、关键人物和十年演变的研究框架。Gemini的原则分析同样扎实,但真题检索却出现了明显漏洞,甚至丢失了部分原始表述。豆包则给出了全场最长的输出——从2011年逐年罗列到2025年,每一年都标注了命题背景、命题思路和官方解读,宛如一部“高考作文年鉴”。ChatGPT和Kimi则走了数据库路线,前者产出了一个按证据等级分A、B、C的Excel索引表,后者整理了一张专家观点表格,都更侧重于信息整理而非深度分析。

尽管方法论迥异,五个模型在“命题组想要什么”这件事上达成了高度共识。它们都读懂了“立德树人、一核四层四翼、反套作、情境化、思辨性”这一套核心密码。而更令人震撼的是,当它们各自出题时,分歧几乎消失了。Gemini的题目是“零摩擦生活”:算法精准推送、导航避开拥堵、智慧生活圈免去线下繁琐,但人类的成长往往发生在遭遇阻力与绕道远行之时。Kimi做了古今对照:1936年长征结束,老红军说“终点在前方,走过去了才知道”;2026年,年轻人却在社交媒体上写“我走的每一步都是‘正确’的,但我越来越不知道自己想去哪里”。豆包的题叫“快捷键时代”:AI一键生成文案、视频倍速播放、学习追求速成,而敦煌工匠用一生打磨壁画,故宫修复师耗时几十年复原文物。ChatGPT写的是“尺度”:分数、排名、流量、效率这些“尺子”帮人们看见差距,但热爱、坚守、独立的判断、对他人的体谅却不容易被量出来。

这场实验揭示了一个深层现实:AI不仅学会了出题,更学会了理解教育中那些最微妙的价值。它们不约而同地选择了同一个母题——技术越便利,人的成长就越需要“阻力”。这或许正是高考作文命题组反复强调“反套作”和“思辨性”的深层逻辑。对于AI从业者而言,这一结果也提供了重要启示:当模型能够从海量数据中抽象出如此一致的价值观时,我们或许应该重新思考AI在教育评估中的角色——它不再只是一个答题工具,更有可能成为理解教育本质的“镜子”。而对于即将走进考场的考生来说,无论AI押中了什么,真正重要的永远是那些无法被算法量化的东西:独立思考的能力、面对不确定性的勇气,以及在便利时代依然选择“绕道远行”的智慧。