最近一项研究揭示了一个反直觉的现象:在具备推理能力的模型中(如DeepSeek-R1),随着推理轨迹长度增加,立场偏差反而加剧。这直接挑战了“更长推理=更理性”的普遍假设。从技术角度看,这暗示当前链式思维推理可能并非纯粹的逻辑深化,而是引入了更多语义层面的先验偏见。例如,在多选题测试中,模型对某个选项的偏好会随着推理步骤增多而固化,类似人类“越思考越固执”的认知偏差。

个人经验上,我曾用R1处理争议性问答,发现其长链推理确实容易陷入自我强化循环,甚至将中立问题解读出倾向性。这让我怀疑:推理优化是否在无意中放大了训练数据中的隐性立场?

抛两个问题:1. 是否可能通过对抗性训练或立场感知正则化来抑制这种长度驱动的偏差?2. 对于长链推理,我们是否需要建立“推理可信度”指标,而非仅关注答案正确性?

行业来看,这一发现对AI安全与公平性至关重要——尤其当推理模型被用于法律、医疗等需要“深思熟虑”的场景。若长链推理反而引入偏见,那么“更智能”可能意味着“更不靠谱”。期待大家分享实测经验或缓解思路。