点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI模型有望提升医疗匮乏地区诊断水平
首页> 科技频道> 综合新闻 > 正文

AI模型有望提升医疗匮乏地区诊断水平

来源:中国科学报2026-02-10 09:38

  中国科学报讯 2月6日,两项发表于《自然-健康》的研究表明,成本低廉的大语言模型(LLM)能够在医疗资源有限的地区提高诊断成功率。在卢旺达和巴基斯坦的卫生保健环境中,其表现甚至超过了训练有素的临床医生。

  大语言模型有望改变医疗资源匮乏地区的现状。图片来源:Guerchom Ndebo

  在卢旺达,聊天机器人在各项评估指标上的得分均超过当地临床医生;而在巴基斯坦,使用LLM辅助诊断的医生平均诊断推理得分为71,而使用传统资源的医生得分为43。

  “这些论文凸显了LLM可助力中低收入国家临床医生提高护理水平。”英国牛津大学人工智能(AI)伦理研究所的Caroline Green说。

  在医学领域,LLM不仅能通过医学研究生的水平考试,还能帮助临床医生进行诊断。不过,这些均为受控基准测试中的表现。那么,在无法核对答案、患者众多且资源有限的真实环境中,LLM表现究竟如何呢?为找到答案,两个独立研究团队分别在卢旺达与巴基斯坦进行了研究。

  在卢旺达,研究人员测试了LLM能否在4个卫生资源匮乏地区为患者提供准确的临床信息。“这些地区面临医护人员短缺问题,无法接诊全部患者,多数患者由培训不足的社区工作者来接诊和分诊。”该研究作者、非营利性国际健康组织PATH的首席AI官Bilal Mateen说。

  Mateen团队让当地约100名社区卫生工作者编制了一份包含5600个临床问题的清单,均为患者最常提出的问题。研究人员将5个LLM对其中约500个问题的回答,与经过培训的当地临床医生的回答进行了对比。结果显示,在11个评价指标上,所有LLM的表现均优于当地医生。此外,LLM还可使用卢旺达语回答约100个问题。

  Mateen表示,与人类相比,LLM还有另一个优势——可全天候接受社区健康工作者的咨询。此外,LLM成本低廉——医生的费用为5.43美元、护士为3.80美元,而LLM用英语回答的成本为0.0035美元、用卢旺达语回答的成本为0.0044美元。

  但美国贝斯以色列女执事医疗中心的临床和AI研究员Adam Rodman对将LLM与人类表现进行比较持怀疑态度,认为基于书面答案的评估机制更适合衡量模型性能,对人类表现则不那么有效。

  在巴基斯坦,由拉合尔管理科学大学的计算机科学家Ihsan Qazi领导的研究团队,对LLM在真实环境中的应用进行了研究。结果发现,在缺乏医学专家、患者数量庞大、诊断错误率高的巴基斯坦,LLM可以提高诊断准确性。

  Qazi团队进行了一项随机对照试验——58名执业医师接受了20小时培训,学习如何使用LLM来辅助诊断患者症状,并警惕程序可能出现的错误或“幻觉”。结果表明,在审查临床病例时,访问GPT-4o LLM的医生的诊断准确性评分显著高于仅使用生物医学数据库PubMed和互联网的医生。

  分析发现,LLM得分甚至高于由其辅助的医生,但也存在例外——在31%的病例中,医生表现优于AI的中位数表现。“这些病例多涉及临床警示特征、背景因素,而这正是LLM所遗漏的。”Qazi说。

  Qazi预计,上述研究结果也适用于其他国家,但仍需使用不同模型开展重复验证。

  Green提醒,LLM存在偏见和患者数据保密性问题,需高度警惕,绝不能采纳由LLM提供的片面医疗保健理念。Qazi则警告,对AI的依赖可能导致医生不加质疑地接受有缺陷的答案,如研究中发现的遗漏临床警示特征、背景因素等案例。 (徐锐)

  相关论文信息:

  https://doi.org/10.1038/s44360-025-00038-1

  https://doi.org/10.1038/s44360-025-00007-8

  《中国科学报》 (2026-02-10 第2版 国际)

[ 责编:李欣哲 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 广西全州:一家人守护烈士墓92年

  • 三峡南线船闸、葛洲坝二号船闸停航检修有序推进

独家策划

推荐阅读
征求意见稿提出,任何组织和个人提供、使用数字虚拟人服务,不得以丑化、污损等形式侵害他人人格权,未经特定自然人同意,不得提供足以识别特定自然人身份的数字虚拟人服务。
2026-04-03 17:59
近日,《关于加快建立长期护理保险制度的意见》(以下简称《意见》)印发。《意见》明确,用3年左右时间,基本建立适应我国基本国情的长期护理保险制度。
2026-04-03 10:07
春天,风媒花粉对过敏症患者尤其是患有慢性呼吸系统病人群的影响特别大,是过敏性哮喘的高发季节。
2026-04-03 10:04
个人信息保护法施行以来,中央网信办会同有关部门持续加大个人信息保护工作力度,查处各类违法违规处理个人信息行为,督促指导个人信息处理者不断提升合规水平,取得了积极成效。
2026-04-03 09:59
日前,福建龙岩长汀县远丰优质稻专业合作社正忙着把秧苗往田里送,并用机器进行插秧。一粒粒种子在智慧育秧工厂从孕育到出苗,直至送入农田进行机械化插秧,合作社负责人傅木清都看在眼里。
2026-04-03 09:53
据报道,在3月29日结束的世界超级摩托车锦标赛(WSBK)葡萄牙站WorldSSP组别中,我国摩托车制造商“张雪机车”在该站赛事双回合正赛中相继夺冠。说起“张雪机车”的成功,不得不提到中国的“摩托之都”重庆。
2026-04-03 09:50
在一间会议室里,记者找到了研究院副院长张金友。”  为了尽快解决这个“烧脑”的问题,这段时间,张金友和团队几乎每天井场、实验室、会议室三点一线。“如果说我们正在采的页岩油是已经蒸熟的‘米饭’,那低熟页岩油就是‘生米’,需要人工在地下为其加热,催化生成石油。
2026-04-03 09:47
历时多年攻关,刘河生带领团队不断改进脑功能区定位技术,实现快速精准绘制个体脑图,并研发出可无创干预脑区功能的设备,在帕金森等疾病治疗研究中取得重大进展。
2026-04-02 10:11
我国智能航运发展现状如何?“十五五”时期如何迈向国际先进水平?记者采访了交通运输部海事局及相关企业。
2026-04-02 10:07
科技创新是发展新质生产力的核心要素,加强原始创新和关键核心技术攻关,是抢占科技制高点、实现高水平科技自立自强的根本所在。
2026-04-02 10:04
近日,国家医保局发布《医疗保障基金使用监督管理条例实施细则》,于2026年4月1日起正式施行。
2026-04-02 10:03
国家卫健委和国家中医药局1日联合印发《关于开展基层医疗卫生机构医疗质量改善三年行动(2026—2028年)的通知》,推进基层医疗质量提升,推动实现分级诊疗“基层首诊”落地。
2026-04-02 10:01
人与自然和谐共生是中国式现代化的重要特征之一,守好碧海银滩,构建人海和谐的海洋生态环境是中国式现代化的题中应有之义。
2026-04-01 09:45
2021年长江十年禁渔实施以来,禁渔秩序总体平稳,退捕渔民生计有效保障,水生生物资源衰退趋势得到决定性扭转,长江水生生物完整性指数稳步提升,取得阶段性明显成效。
2026-04-01 09:44
“过去雷达网建设主要解决‘有没有’的问题,现在AI让这张网从‘能探测’升级为‘会思考’。”在张兴赢看来,“AI正在成为工程的‘第二大脑’。”
2026-04-01 09:43
硒是人体必需的微量矿质营养素。然而,我国约7亿人口存在硒摄入不足。
2026-04-01 09:42
强对流天气的形成是水汽条件、不稳定状态的大气层结构、地形等多种条件协同作用的结果,包括雷暴、短时强降水、大风、冰雹等天气现象,具有影响快、强度强、致灾性强的特点。
2026-04-01 09:39
3月30日,世界数据组织正式成立并落户北京,理事长由中国科学院院士谭铁牛担任。这不仅是对谭铁牛个人学术成就的认可,更是国际社会对中国数据发展和治理能力的充分肯定,是中国科学家提升全球科技治理话语权的生动缩影。
2026-03-31 10:23
教育部30日印发《校园食品安全“十必须”》《学校食堂工作人员“十不准”》,进一步筑牢校园食品安全防线,明确中小学、幼儿园食堂不得制售冷荤类食品、生食类食品、冷加工糕点,不得加工制作四季豆、鲜黄花菜、野生蘑菇、发芽土豆等高风险食品。
2026-03-31 10:22
30日19时00分,力箭二号遥一运载火箭在东风商业航天创新试验区发射升空,将搭载的新征程01卫星、轻舟初样试飞船和天视卫星01星顺利送入预定轨道,发射任务取得圆满成功。
2026-03-31 10:17
加载更多