研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当

研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当

4 月 21 日消息,大阪都会大学医学研究生院 Hirotaka Takita 博士和 Daiju Ueda 副教授领导的研究小组近期发布一项系统性回顾和荟萃分析,深入评估了生成式人工智能(AI)在诊断医疗状况方面的表现,并将其与医生进行了对比。

研究团队筛选了总计 18371 项研究,最终确定 83 项进行详细分析。这些研究涉及多种生成式 AI 模型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,覆盖了多个医疗领域。其中,GPT-4 是研究最多的模型。结果显示,这些 AI 模型的平均诊断准确率为 52.1%(95% 置信区间:47.0% - 57.1%)。部分模型的诊断准确率与非专家医生相当,两者之间没有显著统计差异(准确率差异:0.6% [95% 置信区间:-14.5% 至 15.7%],p=0.93)。然而,专家医生的表现仍优于 AI,其准确率差距为 15.8%(95% 置信区间:4.4% - 27.1%,p=0.007)。尽管如此,随着技术的不断进步,这一差距可能会逐渐缩小。

研究还发现,AI 在大多数医学专科的表现较为一致,但有两个例外:皮肤科和泌尿科。在皮肤科,AI 的表现更为出色,这可能是因为该领域涉及模式识别,而这是 AI 的强项。但皮肤科同样需要复杂的推理和针对患者的决策,因此 AI 的优势并不能完全反映其在该领域的实际应用价值。对于泌尿科,研究结果仅基于一项大型研究,因此其结论的普适性受到一定限制。

“这项研究表明,生成式 AI 的诊断能力与非专家医生相当。它可以用于医学教育,支持非专家医生,并在医疗资源有限的地区协助诊断。”Hirotaka Takita 博士表示,“未来的研究需要在更复杂的临床场景中进行评估,使用实际病历进行性能评估,提高 AI 决策的透明度,并在不同患者群体中进行验证,以进一步证实 AI 的能力。”

注意到,除了诊断领域,该研究还强调了生成式 AI 在医学教育中的潜力。研究人员指出:“当前生成式 AI 模型在非专家环境下的表现与医生相当,这为将 AI 整合到医学培训中提供了机会。” AI 可以用于模拟真实病例,帮助医学生和受训者学习和评估他们的技能。

然而,研究也对这些模型的透明度和偏见提出了担忧。许多 AI 系统并未公开其训练数据的详细信息,这引发了关于其结果是否适用于所有人群的疑问。研究人员强调,“透明度确保了对模型知识、背景和局限性的理解”,并强调需要开发清晰、符合伦理且经过充分验证的 AI 应用。

目前,尽管生成式 AI 具有巨大潜力,但在涉及详细患者信息的复杂病例中仍面临挑战。医生们是否需要担心失去工作?目前尚难定论,但在诊断领域,这种情况是有可能发生的。

特别声明:[研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

香港一12岁男童确诊基孔肯雅热 外地输入首例(香港17岁少年发声)

香港特区政府卫生署卫生防护中心传染病处主任欧家荣宣布,香港出现了今年首例由外地输入的基孔肯雅热病例。患者是一名12岁男童,正在医院接受治疗,目前情况稳定。这名男童于7月17日至30日与母亲前往广东省佛山顺德旅游,在户外活动时被蚊子叮咬

香港一12岁男童确诊基孔肯雅热 外地输入首例(香港17岁少年发声)

企业无资质却敢开飞机带人上天 安全隐患不容忽视(无资质公司可以营业吗)

今年5月,江苏苏州一景区内发生了一起观光直升机事故。一架载有4人的直升机从约十米高的位置突然快速下坠,造成机上4人受伤,1名地面游客不幸身亡

企业无资质却敢开飞机带人上天 安全隐患不容忽视(无资质公司可以营业吗)

热搜第一!黄晓明再迎坏消息,这次将他送上榜的,不止前妻和前任(热搜榜单第一名)

首先登场的是早已和他分手的 “神仙前任” 叶珂,人家高调宣布复出搞直播,自带的流量 Buff 直接把俩人那些尘封已久的陈年旧事又炒成了一锅沸腾的麻辣香锅,热度蹭蹭往上涨;紧接着,网络上突然传出他和杨颖曾经那…

热搜第一!黄晓明再迎坏消息,这次将他送上榜的,不止前妻和前任(热搜榜单第一名)

杨幂15年前的博文因赵露思解约风波火了:“有本事就杀了我,杀不死,就等着看我变得更强大吧!”(杨幂早年微博博文)

新闻荐读 8月3日,记者注意到,众多网友到杨幂2010年发布的一条博文下留言打卡并@赵露思。其代表作品有《神雕侠侣》《王昭君》《宫锁心玉》《北京爱情故事》《小时代》《亲爱的翻译官》《三生三世十里桃花》《逆时营…

杨幂15年前的博文因赵露思解约风波火了:“有本事就杀了我,杀不死,就等着看我变得更强大吧!”(杨幂早年微博博文)

米哈游联合创始人蔡浩宇主导AI新游即将登陆Steam,探索人与AI情感交互(米哈游三个创始人分工)

凤凰网科技讯 8月4日,由米哈游联合创始人之一蔡浩宇主导开发的人工智能(AI)驱动的新型游戏《Whispers from the Star》(暂译《群星低语》)近日公布了其完整版的上线计划。此外,完整版还将增…

米哈游联合创始人蔡浩宇主导AI新游即将登陆Steam,探索人与AI情感交互(米哈游三个创始人分工)