上交x创智x瑞金联合发布CX-Mind：胸片诊断进入“可验证推理”时代

{
title: "CX-Mind：胸片AI迈入可验证推理新阶段",
summary: "上海交通大学、上海创智学院与瑞金医院联合发布CX-Mind，这是首个将胸片诊断推进为可验证推理链的多模态大模型。它不再只给出答案，而是提供每一步的影像证据支持。在708,473张影像的评测中，三大能力域平均提升25.1%，真实世界测试中多中心医生评价五项第一。",
content: "医学影像AI长期以来面临一个核心困境：模型能准确识别病灶，却无法像医生一样解释诊断依据。上海交通大学、上海创智学院与瑞金医院联合发布的CX-Mind，首次将胸片诊断从黑箱分类推进到可验证推理链阶段，标志着医学AI进入一个全新范式。\n\nCX-Mind的核心突破在于重新定义了输出范式。传统模型往往采用one-shot judgment路线，输入影像后直接输出标签或报告，即使引入思维链，也常常变成难以验证的长文本。CX-Mind采用interleaved reasoning设计，将医学推理拆解为think-answer交错单元：每一步先围绕影像证据进行观察和推断，再输出阶段性答案，随后完成鉴别、定位和报告生成。这种方式更接近真实阅片流程，让医生能逐项复核模型的推理过程。\n\n在数据与训练层面，团队构建了大规模胸片指令数据集CX-Set，整合23个公开数据集，包含708,473张影像和2,619,148条指令样本，并进一步构建42,828条由真实放射学报告监督的高质量交错式推理样本。模型被训练掌握三大能力域：视觉理解用于疾病识别和多病共存诊断，文本生成用于撰写报告，时空对齐用于影像-文本匹配和疾病进展判断。在横跨23个数据集的评测中，CX-Mind在这三大能力域平均提升25.1%，在真实世界测试集Rui-CXR上，多中心医生主观评估五项维度全部排名第一。\n\nCX-Mind还提出了CuRL-VPR强化学习框架，通过课程式训练和可验证过程奖励，同时约束答案正确性与推理路径可靠性。这一设计有效解决了医学诊断中奖励稀疏和医学幻觉问题。随着CX-Mind的开源发布，医学影像AI正从辅助工具向临床推理伙伴进化，未来有望在更广泛的影像诊断场景中实现可解释、可复核的智能协作。"}

上交x创智x瑞金联合发布CX-Mind：胸片诊断进入“可验证推理”时代

相关推荐

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首

苹果智能眼镜或复制手表策略，剑指2000亿眼镜市场

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首