Nat Med:真实世界研究利用AI提高乳腺癌检出率,可有效缓解放射科医生短缺情况

时间:2025-01-20 12:09:38   热度:37.1℃   作者:网络

乳腺癌是全球女性群体中发病率最高的恶性肿瘤之一,严重危害了广大女性的身心健康。目前,常见乳腺癌筛查方法包括乳腺X线筛查、乳腺超声筛查等。其中,乳腺X线筛查是首选的影像检查方法,可检出临床触诊阴性的早期乳腺癌,降低与乳腺癌相关的死亡率。

乳腺X线筛查通常由两名放射科医生独立对同一乳房X光片进行审查,耗时较长且缺乏足够的放射科医生支持,人工智能(AI)技术则有望解决这些问题。多项回顾性研究表明,AI在检测乳腺癌方面的准确性与放射科医生相当,有时甚至更高;AI通过识别人类难以察觉的细微异常来辅助放射科医生工作,可减少工作量。但现有研究在验证AI在真实临床环境中性能方面仍存在局限性。

近日,德国吕贝克大学科研团队在Nature Medicine上发表了题为“Nationwide real-world implementation of AI for cancer detection in population-based mammography screening”的文章。研究团队开展了一项名为PRAIM的观察性、多中心、真实世界研究,通过在德国12个地点对463,094名女性进行乳腺X线筛查,比较了AI系统“Vara MG”支持的双重读片与标准双重读片(无AI)的性能。结果显示,Vara MG可显著提高乳腺癌检出率,并同时保持标准乳腺X线筛查双重读片的召回率。总之,该研究强调了AI在提高乳腺癌筛查指标和缓解放射科医生短缺方面的潜力,这可能有助于新标准的制定,即不需要两名放射科医生进行双重阅片。

图片

文章发表在Nature Medicine

PRAIM研究是德国乳腺X线筛查计划(German Mammography Screening program)的一部分。2021年-2023年期间,研究团队从使用AI系统的12个筛查点收集了筛查参与者的数据,共有119名放射科医生和463,094名女(50-69岁)参与这项研究。其中,AI组筛查了260,739名女性,对照组筛查了201,079名女性。

每位女性均被拍摄了4张二维乳腺X光片,这些照片由两名放射科医生独立读片,如发现可疑则召开共识会议;如果共识会议仍存在可疑发现,患者将接受进一步诊断评估。

该研究所用AI系统——Vara MG(来自德国Vara公司)是一款经CE认证的医疗设备,可对乳腺X光片进行预分类,辅助放射科医生进行日常报告。当使用AI支持的检测器时会发现两个功能:一是“Normal triaging”(正常分类),软件会标记AI模型认为高度不可疑的检查为“正常”;二是“safety net”(安全网),软件会标记AI模型认为高度可疑的检查,并提示放射科医生重新审查其决定,接受或拒绝安全网的建议。

图片

图1. 研究概述

Vara MG对检查结果进行了分类,约56.7%的检查被标记为正常;这一比例在AI组中达59.4%,高于对照组。在AI组中,safety net被触发3,959次,接受1,077次,并最终导致了541次召回和204例乳腺癌确诊。特别地,在Vara MG标记为正常的3.1%检查中,通过共识组的进一步审查,也产生了1,905次召回,82例活检以及20例乳腺癌确诊

表1. AI预测和对放射科医生决策的贡献

图片

在控制已确定混杂因素后,AI组乳腺癌检出率为 6.7‰,相较对照组(5.7‰)高17.6%,即每1000名筛查女性中多检出1名癌症患者;AI组召回率为37.4‰,低于对照组召回率(38.3‰),但无统计学意义的下降(-2.5%),表明AI系统的使用不会对召回率产生负面影响。此外,AI组的召回阳性预测值(PPV)为 17.9%,对照组为14.9%;虽然AI组的活检率比对照组高8.2%,但AI组的活检PPV(64.5%)在统计学上仍明显高于对照组(59.2%)

亚组分析显示,随着筛查轮次、乳腺密度和年龄的增加,乳腺癌检出率在所有亚组中均有所上升,增幅介于+12%至+23%之间;各亚组召回率的相对差异在-5%(50-59岁)和+4%(60-69岁)之间变化。研究团队还进行了各种敏感性分析,发现整合AI的乳腺X线筛查对不同分析决定是稳健的。

表2. 模型预测的AI组和对照组乳腺癌检出、召回率、活检率和共识率及相应差异

图片

图片

为评估AI集成通过自动化减少人员工作量的潜力,研究团队模拟了一个虚构情景,在该场景中AI系统判定为“正常”的筛查结果跳过了放射科医生的直接解读,而是直接被归类为“正常”。在这一情景下,由于放射科医生的缺失,那些可能被AI系统遗漏的乳腺癌指标未能被识别,也不可能进行召回或癌症诊断。

结果显示,在这个模拟实验中,Vara MG系统实现了工作量的显著减少——减少了56.7%;乳腺癌检出率依旧较高,而且在统计上高于对照组16.7%;召回率降低了15.0%,而AI组的活检率比对照组高5.8%。这些结果表明,Vara MG在辅助放射科医生进行乳腺癌筛查检查方面具有潜力。

表3. 虚拟场景中,模型预测的AI组和对照组乳腺癌检出、召回率、活检率和共识率及相应差异

图片

PRAIM研究是目前关于AI在乳腺影像筛查中作用的最全面研究,覆盖了广泛的参与者、放射科医生和设备供应商;详细探讨了AI在不同临床亚组中的效果,对政策制定具有指导意义。该研究表明将AI集成到筛查工作流程中可提高乳腺癌检出率,同时保持原有召回率甚至更低。目前,AI支持的筛查对整体项目性能指标的重要下游影响需要进一步调查。但现有相关结果显示应努力将AI支持的乳腺影像纳入筛查指南,并扩展AI在乳腺摄影筛查项目中的广泛应用。

参考文献:

1.Eisemann, N., Bunk, S., Mukama, T. et al. Nationwide real-world implementation of AI for cancer detection in population-based mammography screening. Nat Med (2025).

https://doi.org/10.1038/s41591-024-03408-6

2.https://www.insideprecisionmedicine.com/topics/oncology/ai-enhances-breast-cancer-detection-rates-can-reduce-radiologist-shortages/?__hstc=126276562.532115043888ec08099ea6c859d5611b.1724816722074.1736230941399.1736349407802.34&__hssc=126276562.1.1736349407802&__hsfp=2857195469&_ga=2.35065313.1186891915.1736349381-878096776.172112186

上一篇: 第三代EGFR-TKI利厄替尼(奥壹新)...

下一篇: Nat Commun:浙江大学冯宇雄等团...


 本站广告