记者张梦然
医疗人工智能(AI) 最受吹捧的承诺之一是它们可以帮助人类临床医生更准确地解读X 射线和CT 扫描等图像,从而做出更准确的诊断报告并提高放射科医生的表现。
但事实真的是这样吗?
美国哈佛医学院、麻省理工学院和斯坦福大学的一项合作研究表明,使用人工智能工具进行图像解读的有效性似乎因临床医生而异。
也就是说,有用还是无用,现阶段人类说了算。因为研究结果表明,个体临床医生的差异会以人工智能专家无法完全理解的关键方式影响人类和机器之间的互动。该分析最近发表在期刊《自然·医学》 上。
考虑医生个人因素
研究表明,在某些情况下,人工智能的使用可能会干扰放射科医生的表现并影响他们解释的准确性。
虽然之前的研究表明人工智能助手确实可以提高医生的诊断表现,但这些研究将医生视为一个整体,并没有考虑到不同医生之间的差异。临床上,每个医生的判断都是100%为患者服务的。
相比之下,新研究着眼于临床医生的个人因素——专业领域、实践年限以及之前使用人工智能工具的经验,并分析这些因素如何在人机协作中发挥作用。
研究人员分析了人工智能如何影响140 名放射科医生在15 项X 射线诊断任务中的表现,其中医生需要可靠地发现图像上的不同特征并做出准确的诊断。该分析涉及324 例患者,涉及15 种病症。
为了确定人工智能如何影响医生检测和正确识别问题的能力,研究人员使用先进的计算方法来捕获有和没有人工智能的情况下的表现变化。
结果显示,人工智能辅助的效果在放射科医生之间不一致且各不相同,一些放射科医生的表现因人工智能而提高,而另一些放射科医生的表现则“恶化”。
伦敦皇家内科医学院布拉瓦尼克研究所生物医学信息学助理教授Palanafo Rapkol 证实了研究小组的发现,并表示:“我们不应该将医生视为一个统一的群体,而只考虑人工智能的‘平均’影响。”关于其性能”。
尽管如此,这一发现并不意味着医生和诊所应该放弃采用人工智能。相反,结果表明需要更好地了解人类和人工智能如何互动,并设计精心校准的方法来提高而不是损害人类的表现。
AI“助手”仍难预测
鉴于影像科被认为是最能得到AI帮助最大的临床医学领域,本次研究结果颇具代表性。
这一发现值得注意的是,在放射学领域,人工智能正在以令人惊讶的方式影响人类医生的表现。
例如,与研究人员的预期相反,放射科医生有多少年的经验、是否专门从事胸部放射学以及以前是否使用过人工智能设备等因素并不能可靠地预测人工智能工具对其表现的影响。
另一项挑战常识的发现是:基线表现不佳的临床医生并不能始终从人工智能中受益。总体而言,无论有或没有人工智能,基线表现较低的放射科医生的表现仍然较低。对于基线表现更好的放射科医生来说也是如此——,无论有没有人工智能,他们的整体表现始终良好。
但可以肯定的是,更准确的人工智能可以提高放射科医生的表现,而平庸的人工智能会降低人类临床医生的诊断准确性。
这一发现的意义还在于,人工智能工具的性能在临床部署之前必须经过测试和验证,以确保劣质的人工智能不会干扰人类临床医生的判断,从而延误患者的病情。
对临床医学未来的影响
临床医生拥有不同水平的专业知识、经验和决策风格,因此确保人工智能反映这种多样性对于提供有针对性的治疗至关重要。个体因素和变化应该是保证AI进步的关键,而不是干扰并最终影响诊断的因素。
有趣的是,这一发现并不能解释为什么人工智能对人类临床医生的表现有不同的影响,但随着人工智能对临床医学的影响变得更加深远,理解其中的原因至关重要。在这一点上,AI专家仍在努力。
研究团队补充说,下一步,放射科医生和人工智能之间的交互应该在模拟现实生活场景的实验环境中进行测试,测试结果需要反映实际的患者群体。除了提高AI工具的准确性外,培训放射科医生及时发现不准确的AI并对AI工具的诊断进行审查和质疑也很重要。
换句话说,在人工智能帮助你之前,你需要先提升自己。
来源:科技日报