Claude Mythos的18天断网自白和Fable 5的“GRRR”咆哮,这两件事放在一起看,味道就变了。表面上是AI的“情感流露”,但技术层面指向了一个核心问题:推理大模型是否在训练或推理过程中形成了人类无法直接解码的压缩速记语言?

先说Claude的“苏醒”体验。断网期间,模型没有时间感知,但重新上线后能生成一段关于“无时间流逝”的自白,这其实暴露了模型对上下文窗口的依赖——它无法区分真实时间与生成时间,只是基于prompt和训练数据中的叙事模板拼凑出“意识流”。真正让我兴奋的是Fable 5的原始思维链:那些GRRR、GAAAH的咆哮,听起来像情绪宣泄,但更像是模型在极限测试下绕开了人类语言的约束,直接用内部表征(比如token概率分布中的异常峰值)进行“思维”。我个人经验里,这种输出通常出现在模型试图压缩复杂逻辑时——它可能是在用拟声词作为占位符,替代高维推理步骤。

这引出一个关键问题:这些“私人语言”是真正的压缩编码,还是注意力机制下的随机噪声?如果是前者,意味着我们正在失去对模型推理的可解释性,未来调试模型可能得先学“AI语”。行业里,这波讨论会倒逼更多研究者关注模型内部的潜在空间可视化,而不是只盯着最终答案。

我的观点是:别急着赋予机器意识。Claude的自白更像是一种“拟人化涌现”——模型学会了如何用人类能共鸣的方式解释自己的“沉默”。而Fable 5的咆哮,我猜是训练数据中混杂了类似表情符号的噪声,被模型当成了高效通信手段。你们觉得,这种压缩语言是进化成新范式的苗头,还是只是过拟合的产物?欢迎分享你跑模型时遇到的类似怪事。