{
title: "CX-Mind:胸片AI迈入可验证推理新阶段",
summary: "上海交通大学、上海创智学院与瑞金医院联合发布CX-Mind,这是首个将胸片诊断推进为可验证推理链的多模态大模型。它不再只给出答案,而是提供每一步的影像证据支持。在708,473张影像的评测中,三大能力域平均提升25.1%,真实世界测试中多中心医生评价五项第一。",
content: "医学影像AI长期以来面临一个核心困境:模型能准确识别病灶,却无法像医生一样解释诊断依据。上海交通大学、上海创智学院与瑞金医院联合发布的CX-Mind,首次将胸片诊断从黑箱分类推进到可验证推理链阶段,标志着医学AI进入一个全新范式。\n\nCX-Mind的核心突破在于重新定义了输出范式。传统模型往往采用one-shot judgment路线,输入影像后直接输出标签或报告,即使引入思维链,也常常变成难以验证的长文本。CX-Mind采用interleaved reasoning设计,将医学推理拆解为think-answer交错单元:每一步先围绕影像证据进行观察和推断,再输出阶段性答案,随后完成鉴别、定位和报告生成。这种方式更接近真实阅片流程,让医生能逐项复核模型的推理过程。\n\n在数据与训练层面,团队构建了大规模胸片指令数据集CX-Set,整合23个公开数据集,包含708,473张影像和2,619,148条指令样本,并进一步构建42,828条由真实放射学报告监督的高质量交错式推理样本。模型被训练掌握三大能力域:视觉理解用于疾病识别和多病共存诊断,文本生成用于撰写报告,时空对齐用于影像-文本匹配和疾病进展判断。在横跨23个数据集的评测中,CX-Mind在这三大能力域平均提升25.1%,在真实世界测试集Rui-CXR上,多中心医生主观评估五项维度全部排名第一。\n\nCX-Mind还提出了CuRL-VPR强化学习框架,通过课程式训练和可验证过程奖励,同时约束答案正确性与推理路径可靠性。这一设计有效解决了医学诊断中奖励稀疏和医学幻觉问题。随着CX-Mind的开源发布,医学影像AI正从辅助工具向临床推理伙伴进化,未来有望在更广泛的影像诊断场景中实现可解释、可复核的智能协作。"}