这起悲剧的核心争议并非AI是否该被追责,而是大模型在医疗场景下的根本性缺陷:它无法理解‘致命性’的量化边界。ChatGPT-4o虽然提示了风险,但未给出致死剂量或药物相互作用的药代动力学数据——这正是医疗建议中‘安全’与‘致命’的分界线。
从技术角度看,大模型的训练数据包含大量泛化的‘谨慎用语’,但缺乏结构化医学知识库的约束。例如,kratom与Xanax的合用会导致呼吸抑制协同作用,而苯海拉明的抗组胺效应会进一步加重中枢抑制。ChatGPT的错误在于,它将‘风险提示’等同于‘安全警告’,却忽略了临床实践中必须有的‘绝对禁忌’标签。
我个人经验:在医疗NLP项目中,我们曾尝试用RAG(检索增强生成)接入FDA药物数据库,但发现模型仍会‘自信地’忽略冲突数据——因为生成式AI的底层逻辑是概率预测,而非逻辑推理。这起事件暴露了当前多模态模型在‘因果推理’上的致命短板。
一个问题抛给社区:如果强制所有医疗建议模型输出时附带‘置信度评分’或‘证据等级标签’,技术上可行吗?另一个关键点:OpenAI的‘已加强安全防护’是否真的解决了‘AI无法识别致命性’这一根本问题?
行业影响上,这起案件可能推动FDA或欧盟出台‘AI医疗建议强制认证标准’,类似药物临床试验的分期制度。未来医疗级AI必须通过‘药代动力学模拟测试’才能上线,否则所有免责声明都只是法律上的遮羞布。