人工智能对肺结节检出及定性的效能评估

姚威 李培秀 霍英杰 梁建利 张新成 冯长明 王红辉 张翔辰

引用本文:
Citation:

人工智能对肺结节检出及定性的效能评估

    通讯作者: 李培秀, lipeixiu@aliyun.com

Evaluation of artificial intelligence in the detection and characterization of pulmonary nodules

    Corresponding author: Peixiu Li, lipeixiu@aliyun.com ;
  • 摘要: 目的 评估人工智能(AI)对肺结节的检出及定性的诊断效能。 方法 采用回顾性研究方法,简单随机抽样选取了2020—2021年河北中石油中心医院肺结节病例库中的355例患者[女性205例、男性150例,年龄(55.1±12.2)岁]的肺部CT图像并导入AI系统。将AI与3名初级职称医师的诊断结果进行对比,2名中级职称医师按照双盲原则对CT图像进行审核,并以2名中级职称医师的一致性意见作为真结节诊断的参考标准,比较AI与初级职称医师对肺结节检出的灵敏度。105例患者于术前CT引导下行穿刺组织病理学检查或肺组织切除术后组织病理学检查,以组织病理学检查结果为“金标准”,比较AI与副主任医师对肺结节定性诊断的灵敏度、特异度、阳性预测值、阴性预测值、准确率。计数资料的组间比较采用卡方检验或Fisher精确概率检验。 结果 355例患者的CT图像中共检出真结节1072个,其中AI共检出真结节1063个,漏诊9个,其灵敏度为99.16%(1063/1072);初级职称医师共检出真结节1009个,漏诊63个,其灵敏度为94.12%(1009/1072)。在肺结节检出方面,AI的灵敏度明显高于初级职称医师,且差异有统计学意义(χ2=41.907,P<0.05)。105例患者经组织病理学检查结果证实为恶性结节88例、良性结节17例。其中AI对肺结节定性诊断的真阳性86例、假阳性15例、真阴性2例、假阴性2例;副主任医师对肺结节定性诊断的真阳性83例、假阳性1例、真阴性16例、假阴性5例。副主任医师对肺结节定性诊断的特异度及阳性预测值均明显高于AI[94.12%(16/17)对11.76%(2/17),Fisher精确概率检验,P<0.05;98.81%(83/84)对85.15%(86/101),χ2=9.172,P<0.05];副主任医师对肺结节定性诊断的灵敏度低于AI,但差异无统计学意义[94.32%(83/88)对97.73%(86/88),χ2=0.595,P>0.05];副主任医师对肺结节定性诊断的阴性预测值高于AI,但差异无统计学意义[76.19%(16/21)对50.00%(2/4),Fisher精确概率检验,P>0.05];总的来说,副主任医师对肺结节定性诊断的准确率高于AI[94.29%(99/105)对83.81%(88/105),χ2=8.796,P<0.05]。 结论 在肺结节的检出及定性诊断中,AI具有较高的灵敏度,但特异度、阳性预测值、阴性预测值及准确率较低。临床工作中,医师可以利用AI良好的灵敏度,帮助提高工作效率,但不能替代人工分析结果作为肺结节定性诊断的标准。
  • 图 1  肺结节患者(女性,57岁)肺部CT图像导入智能辅助诊断智能分析系统的筛查图

    Figure 1.  Screening images of Intelligent Assisted Diagnosis and Intelligent Analysis System for pulmonary nodule patient (female, 57 years old) with lung CT

    图 2  肺结节患者(男性,43岁)肺部CT图像导入智能辅助诊断智能分析系统的筛查图和组织病理学检查图

    Figure 2.  Screening images of Intelligent Assisted Diagnosis and Intelligent Analysis System for pulmonary nodule patient (male, 43 years old) with lung CT and his histopathological examination image

    表 1  AI与影像科医师对1072个肺结节检出的结果比较

    Table 1.  Comparison of artificial intelligence and imaging physicians in detecting 1072 pulmonary nodules

    组别 中级职称
    医师(个)
    AI
    (个)
    初级职称
    医师(个)
    结节大小
     最大径<5 mm组 710 703 650a
     5 mm≤最大径<10 mm组 198 196 195
     10 mm≤最大径<30 mm组 164 164 164
    结节密度
     实性结节组 521 520 508a
     部分实性结节组 72 72 72
     磨玻璃结节组 479 471 428a
    注:a表示与AI相比,差异均有统计学意义(χ2=44.002、8.761、33.396,均P<0.05);AI为人工智能
    下载: 导出CSV
  • [1] Siegel RL, Miller KD, Fuchs HE, et al. Cancer statistics, 2021[J]. CA Cancer J Clin, 2021, 71(1): 7−33. DOI: 10.3322/caac.21654.
    [2] Ather S, Kadir T, Gleeson F. Artificial intelligence and radiomics in pulmonary nodule management: current status and future applications[J]. Clin Radiol, 2020, 75(1): 13−19. DOI: 10.1016/j.crad.2019.04.017.
    [3] Ampavathi A, Saradhi TV. Multi disease-prediction framework using hybrid deep learning: an optimal prediction model[J]. Comput Methods Biomech Biomed Engin, 2021, 24(10): 1146−1168. DOI: 10.1080/10255842.2020.1869726.
    [4] Nishio M, Nishizawa M, Sugiyama O, et al. Computer-aided diagnosis of lung nodule using gradient tree boosting and Bayesian optimization[J/OL]. PLoS One, 2018, 13(4): e0195875[2023-04-05]. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0195875. DOI: 10.1371/journal.pone.0195875.
    [5] 中华医学会呼吸病学分会肺癌学组, 中国肺癌防治联盟专家组. 肺结节诊治中国专家共识(2018年版)[J]. 中华结核和呼吸杂志, 2018, 41(10): 763−771. DOI: 10.3760/cma.j.issn.1001-0939.2018.10.004.
    Lung Cancer Study Group, Chinese Thoracic Society, Chinese Medical Association, Expert Group of Chinese Alliance Against Lung Cancer. Chinese Expert Consensus on the Diagnosis and Treatment of Pulmonary Nodules (2018 Edition)[J]. Chin J Tuberc Respir Dis, 2018, 41(10): 763−771. DOI: 10.3760/cma.j.issn.1001-0939.2018.10.004.
    [6] The International Early Lung Cancer Action Program Investigators. Survival of patients with stage I lung cancer detected on CT screening[J]. N Engl J Med, 2006, 355(17): 1763−1771. DOI: 10.1056/NEJMoa060476.
    [7] Birring SS, Peake MD. Symptoms and the early diagnosis of lung cancer[J]. Thorax, 2005, 60(4): 268−269. DOI: 10.1136/thx.2004.032698.
    [8] Wang XJ, Liu HL, Shen YB, et al. Low-dose computed tomography (LDCT) versus other cancer screenings in early diagnosis of lung cancer: a meta-analysis[J]. Medicine (Baltimore), 2018, 97(27): e11233. DOI: 10.1097/MD.0000000000011233.
    [9] 李培秀, 徐晓磊, 张强, 等. 64层螺旋CT胸部低剂量扫描的临床研究[J]. 医疗卫生装备, 2014, 35(10): 82−84, 96. DOI: 10.7687/J.ISSN.1003-8868.2014.10.082.
    Li PX, Xu XL, Zhang Q, et al. Clinical research of low dose chest scanning by 64-slice spiral CT[J]. Chin Med Equip J, 2014, 35(10): 82−84, 96. DOI: 10.7687/J.ISSN.1003-8868.2014.10.082.
    [10] Obuchowski NA, Bullen JA. Statistical considerations for testing an AI algorithm used for prescreening lung CT images[J/OL]. Contemp Clin Trials Commun, 2019, 16: 100434[2023-04-05]. https://www.sciencedirect.com/science/article/pii/S2451865419301966?via%3Dihub. DOI: 10.1016/j.conctc.2019.100434.
    [11] Hwang EJ, Park CM. Clinical implementation of deep learning in thoracic radiology: potential applications and challenges[J]. Korean J Radiol, 2020, 21(5): 511−525. DOI: 10.3348/kjr.2019.0821.
    [12] Yuan R, Vos PM, Cooperberg PL. Computer-aided detection in screening CT for pulmonary nodules[J]. AJR Am J Roentgenol, 2006, 186(5): 1280−1287. DOI: 10.2214/AJR.04.1969.
    [13] Sung H, Ferlay J, Siegel RL, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209−249. DOI: 10.3322/caac.21660.
    [14] Murthy SC, Rice TW. The solitary pulmonary nodule: a primer on differential diagnosis[J]. Semin Thorac Cardiovasc Surg, 2002, 14(3): 239−249. DOI: 10.1053/stcs.2002.34450.
    [15] Lachance CC, Walter M. Artificial intelligence for classification of lung nodules: a review of clinical utility, diagnostic accuracy, cost-effectiveness, and guidelines [R]. Ottawa, ON: Canadian Agency for Drugs and Technologies in Health, 2020.
    [16] Loverdos K, Fotiadis A, Kontogianni C, et al. Lung nodules: a comprehensive review on current approach and management[J]. Ann Thoracic Med, 2019, 14(4): 226−238. DOI: 10.4103/atm.ATM_110_19.
    [17] Swensen SJ, Jett JR, Hartman TE, et al. CT screening for lung cancer: five-year prospective experience[J]. Radiology, 2005, 235(1): 259−265. DOI: 10.1148/radiol.2351041662.
    [18] McWilliams A, Tammemagi MC, Mayo JR, et al. Probability of cancer in pulmonary nodules detected on first screening CT[J]. N Engl J Med, 2013, 369(10): 910−919. DOI: 10.1056/NEJMoa1214726.
    [19] Kang GX, Liu K, Hou BB, et al. 3D multi-view convolutional neural networks for lung nodule classification[J/OL]. PLoS One, 2017, 12(11): e0188290[2023-04-05]. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0188290. DOI: 10.1371/journal.pone.0188290.
    [20] Lyu J, Ling SH. Using multi-level convolutional neural network for classification of lung nodules on CT images[C]//Proceedings of the 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Honolulu: IEEE, 2018: 686−689. DOI: 10.1109/EMBC.2018.8512376.
    [21] Shaffie A, Soliman A, Fraiwan L, et al. A generalized deep learning-based diagnostic system for early diagnosis of various types of pulmonary nodules[J]. Technol Cancer Res Treat, 2018, 17: 1533033818798800. DOI: 10.1177/1533033818798800.
    [22] Litjens G, Kooi T, Bejnordi BE, et al. A survey on deep learning in medical image analysis[J]. Med Image Anal, 2017, 42: 60−88. DOI: 10.1016/j.media.2017.07.005.
    [23] Fukushima K. Neocognitron: a self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biol Cybern, 1980, 36(4): 193−202. DOI: 10.1007/BF00344251.
  • [1] 董孟杰黄钢 . 医学影像与人工智能. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2020.01.002
    [2] 贾凯丽王雪梅 . 医学影像人工智能新进展. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2020.01.007
    [3] 赵建华柴军张晓琴贺燕林刘瑞孙德俊 . 基于深度学习的新型冠状病毒肺炎转归胸部CT评价. 国际放射医学核医学杂志, doi: 10.3760/cma.j.cn121381-202004048-00101
    [4] 周伟娜张凯秀 . 人工智能机器人在核医学病房中的初步应用与展望. 国际放射医学核医学杂志, doi: 10.3760/cma.j.cn121381-202003036-00104
    [5] 张佳佳樊鑫秦珊珊余飞 . 基于深度学习的人工智能在肿瘤诊断中的应用进展. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2020.01.004
    [6] 王利伟王自正顾建平王丽萍王峰 . 孤立性肺结节的影像学研究进展. 国际放射医学核医学杂志,
    [7] 陆奕行章斌 . 基于深度学习的人工智能应用于甲状腺癌诊断的进展. 国际放射医学核医学杂志, doi: 10.3760/cma.j.cn121381-202203024-00243
    [8] 胡小丽向守洪胡荣慧周代全陈俊源薛雨王政杰 . 人工智能在冠状动脉CT血管成像后处理和诊断报告的初步评估. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2020.01.003
    [9] 王雪梅王美玲王相成 . PET和PET-CT对肺结节良恶性鉴别诊断的临床应用与进展. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2010.02.003
    [10] 刘婧张莺 . 基于深度学习的计算机辅助诊断系统在肺癌早期诊断中的应用与进展. 国际放射医学核医学杂志, doi: 10.3760/cma.j.issn.1673-4114.2020.01.006
  • 加载中
图(2)表(1)
计量
  • 文章访问数:  265
  • HTML全文浏览量:  227
  • PDF下载量:  0
出版历程
  • 收稿日期:  2023-04-06
  • 网络出版日期:  2023-11-08

人工智能对肺结节检出及定性的效能评估

    通讯作者: 李培秀, lipeixiu@aliyun.com
  • 河北中石油中心医院影像科,廊坊 065000

摘要:  目的 评估人工智能(AI)对肺结节的检出及定性的诊断效能。 方法 采用回顾性研究方法,简单随机抽样选取了2020—2021年河北中石油中心医院肺结节病例库中的355例患者[女性205例、男性150例,年龄(55.1±12.2)岁]的肺部CT图像并导入AI系统。将AI与3名初级职称医师的诊断结果进行对比,2名中级职称医师按照双盲原则对CT图像进行审核,并以2名中级职称医师的一致性意见作为真结节诊断的参考标准,比较AI与初级职称医师对肺结节检出的灵敏度。105例患者于术前CT引导下行穿刺组织病理学检查或肺组织切除术后组织病理学检查,以组织病理学检查结果为“金标准”,比较AI与副主任医师对肺结节定性诊断的灵敏度、特异度、阳性预测值、阴性预测值、准确率。计数资料的组间比较采用卡方检验或Fisher精确概率检验。 结果 355例患者的CT图像中共检出真结节1072个,其中AI共检出真结节1063个,漏诊9个,其灵敏度为99.16%(1063/1072);初级职称医师共检出真结节1009个,漏诊63个,其灵敏度为94.12%(1009/1072)。在肺结节检出方面,AI的灵敏度明显高于初级职称医师,且差异有统计学意义(χ2=41.907,P<0.05)。105例患者经组织病理学检查结果证实为恶性结节88例、良性结节17例。其中AI对肺结节定性诊断的真阳性86例、假阳性15例、真阴性2例、假阴性2例;副主任医师对肺结节定性诊断的真阳性83例、假阳性1例、真阴性16例、假阴性5例。副主任医师对肺结节定性诊断的特异度及阳性预测值均明显高于AI[94.12%(16/17)对11.76%(2/17),Fisher精确概率检验,P<0.05;98.81%(83/84)对85.15%(86/101),χ2=9.172,P<0.05];副主任医师对肺结节定性诊断的灵敏度低于AI,但差异无统计学意义[94.32%(83/88)对97.73%(86/88),χ2=0.595,P>0.05];副主任医师对肺结节定性诊断的阴性预测值高于AI,但差异无统计学意义[76.19%(16/21)对50.00%(2/4),Fisher精确概率检验,P>0.05];总的来说,副主任医师对肺结节定性诊断的准确率高于AI[94.29%(99/105)对83.81%(88/105),χ2=8.796,P<0.05]。 结论 在肺结节的检出及定性诊断中,AI具有较高的灵敏度,但特异度、阳性预测值、阴性预测值及准确率较低。临床工作中,医师可以利用AI良好的灵敏度,帮助提高工作效率,但不能替代人工分析结果作为肺结节定性诊断的标准。

English Abstract

  • 据统计,全球约1/4的癌症相关死亡是由肺癌引起的[1] 。大多数肺癌最初表现为结节,其是肺癌早期诊断的依据,肺结节的定义是最大径<3 cm的局灶性异常密度影[2]。由于人类视觉的限制,应用CT对较小结节进行筛查成为一项具有挑战性且耗时的任务。此外,目前良恶性结节的区分仍有赖于影像科医师的视觉评估及对结节大小和密度测量的综合评价,也是一项具有挑战性的任务。

    人工智能(artificial intelligence,AI)是约翰·麦卡锡 (John McCarthy) 于1956年在达特矛斯会议上首次提出的,它是一种使用计算机及其技术来模拟与人类相当的智能行为和批判性思维的方法,能够分析和解释复杂的医疗数据,从而帮助诊断、管理和预测不同临床表现患者的治疗效果[3-4]。近年来,出现了许多对肺结节进行自动检测和分类的AI 算法,其可以帮助影像科医师进行日常的胸部CT图像评估。但由于这些AI 算法存在一定的局限性,导致其在临床工作中的应用仍然有限。本研究通过比较AI与影像科医师在肺结节检出及定性中的诊断情况,评估AI在临床应用中的价值。

    • 本研究采用回顾性研究方法,简单随机抽样选取了2020—2021年河北中石油中心医院肺结节病例库中的355例患者 [女性205例、男性150例,年龄(55.1±12.2)岁]的肺部CT图像数据。纳入标准:CT图像中至少有1个非钙化结节,且结节最大径<3 cm。排除标准:有弥漫性转移、间质性肺病、广泛瘢痕形成、肺炎、肺纤维化、肺水肿的患者;图像存在严重运动伪影。

      本研究已通过中国石油天然气集团公司中心医院(现已更名为河北中石油中心医院)伦理委员会审批(批准号:KYLL-2018-3)。所有患者均于检查前签署了知情同意书。

    • 使用德国西门子公司SOMATOM Definition Flash CT机进行CT图像采集。扫描范围从肺尖至肺底,患者采用低剂量扫描模式采集,扫描参数包括:管电压120 kV,管电流40~60 mA,螺距1.45,旋转转速0.5 s/r,采集准直128×0.6 mm,重建间隔5.0 mm,扫描层厚5.0 mm,重建层厚1.0 mm,扫描及重建矩阵512×512。

    • 105例患者于术前CT引导下行穿刺组织病理学检查或肺组织切除术后组织病理学检查,由病理科医师进行诊断。

    • 将患者肺部CT图像导入上海联影智能辅助诊断智能分析系统(版本:uAiportal20230430sp1_hotfix2),同时记录每个非钙化结节的大小、密度、形态、危险分层。根据肺结节诊治中国专家共识(2018 年版)[5]的分类标准将结节按最大径分为3组:最大径<5 mm组、5 mm≤最大径<10 mm组、10 mm≤最大径<30 mm;按结节密度分为3组:实性结节组、部分实性结节组和磨玻璃结节组。将AI与3名初级职称影像科医师的诊断结果进行对比,2名中级职称医师按照双盲原则对CT图像进行审核,以2名中级职称医师的一致性意见作为真结节诊断的参考标准,当意见不一致时请求上级医师会诊,以会诊意见作为真结节诊断的参考标准。对比AI及初级职称医师对肺结节检出的灵敏度。另外,以组织病理学检查结果为“金标准”,并结合随访结果,对比1名副主任医师与AI对肺结节定性诊断的灵敏度、特异度、阳性预测值、阴性预测值、准确率。

    • 应用SPSS 25.0软件对数据进行统计学分析。计数资料以例数(百分比)表示,组间比较采用卡方检验或Fisher精确概率检验。当总个(例)数≥40,且各组个(例)数≥5时,采用Pearson卡方检验;当总个(例)数≥40,1≤任意一组最小个(例)数<5时,采用连续校正卡方检验;当总个(例)数<40,或任意一组最小个(例)数<1时,采用Fisher精确概率检验。P<0.05为差异有统计学意义。

    • 355例患者的CT图像中共检出真结节1072个。其中,AI共检出真结节1063个,漏诊9个,灵敏度为99.16%(1063/1072);初级职称医师共检出真结节1009个,漏诊63个,灵敏度为94.12%(1009/1072),二者的差异有统计学意义(χ2=41.907,P<0.05)。1072个真结节中,最大径<5 mm组结节710个,AI检出703个、漏诊7个,灵敏度为99.01%(703/710),初级职称医师检出650个、漏诊60个,灵敏度为91.55%(650/710),二者的差异有统计学意义(χ2=44.002,P<0.05);5 mm≤最大径<10 mm组结节198个,AI检出196个、漏诊2个,灵敏度为98.99%(196/198),初级职称医师检出195个、漏诊3个,灵敏度为98.48%(195/198),二者的差异无统计学意义(χ2=0.000,P>0.05);10 mm≤最大径<30 mm组结节164个,AI检出164个,灵敏度为100%(164/164),初级职称医师检出164个,灵敏度为100.00%(164/164),二者的差异无统计学意义(Fisher精确概率检验,P>0.05)。1072个真结节中,实性结节组521个,AI检出520个、漏诊1个,灵敏度为99.81%(520/521),初级职称医师检出508个、漏诊13个,灵敏度为97.50%(508/521),二者的差异有统计学意义(χ2=8.761,P<0.05);部分实性结节组72个,AI检出72个,灵敏度为100%(72/72),初级职称医师检出72个,灵敏度为100%(72/72),二者的差异无统计学意义(Fisher精确概率检验,P>0.05);磨玻璃结节组479个,AI检出471个、漏诊8个,灵敏度为98.33%(471/479),初级职称医师检出428个、漏诊51个,灵敏度为89.35%(428/479),二者的差异有统计学意义(χ2=33.396,P<0.05)(表1)。典型病例的图像见图1

      组别 中级职称
      医师(个)
      AI
      (个)
      初级职称
      医师(个)
      结节大小
       最大径<5 mm组 710 703 650a
       5 mm≤最大径<10 mm组 198 196 195
       10 mm≤最大径<30 mm组 164 164 164
      结节密度
       实性结节组 521 520 508a
       部分实性结节组 72 72 72
       磨玻璃结节组 479 471 428a
      注:a表示与AI相比,差异均有统计学意义(χ2=44.002、8.761、33.396,均P<0.05);AI为人工智能

      表 1  AI与影像科医师对1072个肺结节检出的结果比较

      Table 1.  Comparison of artificial intelligence and imaging physicians in detecting 1072 pulmonary nodules

      图  1  肺结节患者(女性,57岁)肺部CT图像导入智能辅助诊断智能分析系统的筛查图

      Figure 1.  Screening images of Intelligent Assisted Diagnosis and Intelligent Analysis System for pulmonary nodule patient (female, 57 years old) with lung CT

    • 105例患者经组织病理学检查结果证实为恶性结节88例、良性结节17例。其中AI对肺结节定性诊断的真阳性86例、假阳性15例、真阴性2例、假阴性2例;副主任医师对肺结节定性诊断的真阳性83例、假阳性1例、真阴性16例、假阴性5例。副主任医师对肺结节定性诊断的特异度及阳性预测值均明显高于AI[94.12%(16/17)对11.76%(2/17),Fisher精确概率检验,P<0.05;98.81%(83/84)对85.15%(86/101),χ2=9.172,P<0.05];副主任医师对肺结节定性诊断的灵敏度低于AI,但差异无统计学意义[94.32%(83/88)对97.73%(86/88),χ2=0.595,P>0.05];副主任医师对肺结节定性诊断的阴性预测值高于AI,但差异无统计学意义[76.19%(16/21)对50.00%(2/4),Fisher精确概率检验,P>0.05];总的来说,副主任医师对肺结节定性诊断的准确率高于AI[94.29%(99/105)对83.81%(88/105),χ2=8.796,P<0.05]。典型病例的图像见图2

      图  2  肺结节患者(男性,43岁)肺部CT图像导入智能辅助诊断智能分析系统的筛查图和组织病理学检查图

      Figure 2.  Screening images of Intelligent Assisted Diagnosis and Intelligent Analysis System for pulmonary nodule patient (male, 43 years old) with lung CT and his histopathological examination image

    • 由于肺癌的发病率和病死率均较高,而肺结节可能是肺癌的早期征兆,因此,肺结节的早期发现和治疗能够显著降低肺癌的病死率[6-7]。基于人群的早期、有效的肺癌筛查对于提高患者5年生存率至关重要。

      CT对肺结节和早期肺癌的检测具有较高的灵敏度。采用低剂量CT对高危人群进行筛查以提高早期肺癌的诊断效果和预后已成为众多国际权威医疗组织的共识[8-9],但是大量CT图像的分析对影像科医师来说也是一个挑战。

      AI可以帮助影像科医师完成日常工作流程[10],尤其是在肺癌的筛查中,AI可以用于检测结节的确切位置及分割并量化结节的大小,显著减轻了影像科医师的工作负担[11]。本研究结果显示,在肺结节的检出和定性方面,AI的灵敏度均高于初级职称医师和副主任医师;在微结节及磨玻璃结节的检出方面,因为结节与周围实质之间的衰减差异较小,初级职称医师的漏诊率较高。有研究结果证实亚实性结节(包括磨玻璃或部分实性结节)比实性结节具有更高的恶性可能性[12],AI能更灵敏、高效地检出这些结节,对于临床具有重大意义。且研究结果显示,AI对常规剂量扫描和低剂量扫描的CT图像都能很好地识别[9]

      此外,AI的另一个应用是确定风险分层,从而将结节分类为良性或恶性。肺结节作为肺癌重要的早期表现,其性质的鉴别一直是临床工作的重点和难点[13-14],误诊会导致良性结节的过度诊疗以及恶性结节的病情进展。本研究结果表明,在肺结节的定性方面,副主任医师诊断的特异度及阳性预测值均明显高于AI(均P<0.05),阴性预测值也高于AI,但差异无统计学意义(P>0.05)。总的来说,副主任医师诊断的准确率高于AI(P<0.05)。分析其原因可能是因为AI对于肺结节定性的相关算法仍在开发中[15],本研究中患者的一些生理结构或良性病变,如血管横断面(尤其是肺门血管)、第一肋软骨钙化、脊柱的退变、局部胸膜增厚被AI误诊为结节,甚至划分为恶性结节。出现此类偏差的一个原因可能是这些生理结构或良性病变被排除在肺癌筛查数据集之外造成的;另一方面,AI诊断恶性肿瘤的效能与结节大小密切相关[16],CT 图像中较大的结节所包含的特征更丰富,钙化结节的信号强度更高,容易造成AI结果假阳性,但是大的结节并不一定是恶性的 [17]。在PanCan筛查队列中,大约20%的肺癌患者的恶性结节的大小并不是所有肺结节中最大的 [18]。有临床经验的医师可结合患者的临床资料,如症状、吸烟史、家族史等以及随访对比结果进行诊断,以减少误诊。

      AI领域中常用的2种算法包括机器学习和深度学习。有研究结果显示,对于肺结节的分类,深度学习算法优于标准机器学习算法 [19-20]。2018年,Shaffie等[21]应用了一种通用的深度学习系统,该系统在区分恶性结节和良性结节方面达到了91.2%的准确率,因此有可能成为肺癌检测的有价值的工具 。本研究具有一定的局限性。首先,本研究应用的AI系统是基于三维卷积神经网络算法[22]的肺结节深度学习算法模型所得结果,这种算法最初是由Fukushima[23]在1980年提出的。大多数算法,尤其是深度学习算法,都需要大型匿名数据集的训练,而本研究所用AI系统训练数据集是远远不够的。其次,本研究是一项回顾性单中心研究,样本数量有限,尤其是有组织病理学检查结果的样本较少,需要在后续研究中进一步完善。

      总的来说,为执行肺结节分类而创建的任何 AI 算法都可能同时存在假阳性和假阴性。这两者之间需要进行权衡取舍,如果设计成没有假阴性的算法,那么假阳性的数量将会增加,反之亦然。当 AI系统漏诊结节时,如果影像科医师不进一步审核,可能会错误地认为受检者是健康的,从而延误诊断甚至造成不良预后。相反,如果算法有很多误报,认为存在高风险结节,影像科医师必须优先审核这些高风险结节,从而导致资源分配不当,增加阅片者的工作量。

      综上所述,本研究结果表明,在肺结节的检出及定性诊断中,AI具有较高的灵敏度,但特异度、阳性预测值、阴性预测值及准确率较低。因此,在今后的研究中,我们应采用足够大的数据库进行AI训练,以提高其准确率,并根据具体任务,预测并设置适当的阈值,以实现最佳的AI性能平衡。在目前的临床工作中,医师可以利用AI良好的筛查检出效能,帮助提高工作效率,但不能将其替代人工分析结果作为肺结节定性的诊断标准。AI诊断与医师诊断相结合可以为临床决策提供更准确的信息。

      利益冲突 所有作者声明无利益冲突

      作者贡献声明 姚威负责数据的收集与分析、论文的撰写;李培秀负责提供论文写作的思路、论文的修订;霍英杰、冯长明负责图像的分析;梁建利、张新成负责图像的采集及后处理;王红辉、张翔辰负责数据的统计与分析

参考文献 (23)

目录

    /

    返回文章
    返回