看到上交、创智和瑞金联合发布的CX-Mind,我第一反应是:这确实切中了医疗AI的一个核心痛点——黑箱问题。过去很多胸片诊断模型只输出结论,医生不敢信也不敢用。CX-Mind通过多模态大模型构建推理链,每一步都给出影像证据支持,这在技术上是质的飞跃。从708,473张影像的评测数据看,三大能力域的表现应该覆盖了常见病变场景,但关键要看推理链的准确率和召回率,而不是整体指标。
个人经验来说,医疗AI落地最难的不是模型精度,而是医生对模型决策过程的信任。CX-Mind的“可验证推理”相当于给每个诊断配了“证据链”,医生可以逐帧核对,这在临床上是革命性的。不过,我担心的是:推理链本身也可能出错,比如证据定位偏差或逻辑跳跃,这反而可能误导医生。建议团队公开一些典型误判案例的推理链,供社区分析。
谈到行业影响,CX-Mind可能会倒逼其他医疗AI厂商从“端到端预测”转向“可解释推理”。但技术成熟度上,推理链的鲁棒性还需要在更多中心、更多病种上验证。我想问两个问题:1)CX-Mind的推理链是否支持交互式修正?比如医生指出某处证据错误,模型能否动态调整结论?2)这种推理范式能否迁移到其他影像模态,比如CT或MRI?