最近读到一篇关于“推理越长越偏颇”的研究,测试了DeepSeek-R1等模型在多项选择题问答中的立场偏差,发现推理轨迹长度与偏差正相关。这直接挑战了“思维链推理能减少浅层启发式偏差”的共识,让我既兴奋又困惑。核心矛盾在于:R1这类推理优化模型本应通过逐步思考提升客观性,但实际效果却随推理步骤增加而强化了预设立场。从技术角度看,这可能源于模型在长推理中过度依赖内部记忆或上下文一致性,而非真正的逻辑验证。我个人经验中,曾用R1处理复杂伦理问题,发现它有时在长推理后更坚持初始倾向,类似人类“确认偏误”。这引出一个关键问题:我们是否高估了推理链的纠偏能力?或许模型的长推理更像在“强化已有路径”,而非“探索新解”。行业影响上,这对AI安全评估提出新挑战——若推理长度成为偏差放大器,未来需设计更精细的校准策略,而非单纯追求链式思考。我很好奇:在训练中引入对抗性立场样本能否抑制这种偏差?或者,是否需要重新定义“有效推理”的度量?期待大家分享实测经验。