国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工智能的CT影像預(yù)測肺腺癌浸潤性:Meta分析

2022-11-22 02:53黃文君周秀秀周陶胡葛艷明董鵬范麗
放射學實踐 2022年11期
關(guān)鍵詞:浸潤性腺癌異質(zhì)性

黃文君,周秀秀,周陶胡,葛艷明,董鵬,范麗

國際癌癥研究機構(gòu)更新的最新版GLOBOCAN 2020指出,現(xiàn)今肺癌仍是癌癥死亡的主要原因,同時國內(nèi)肺癌的整體發(fā)病率(56.3/10萬)和死亡率(49.4/10萬)也都居于首位[1]。作為最常見的肺癌亞型,肺腺癌占所有肺癌病例的一半以上[2],可見防控肺腺癌是肺癌防控中的重要一環(huán)。隨著常規(guī)CT的全面覆蓋和低劑量CT篩查的普及,許多肺腺癌能在早期即被檢出[3-4]。目前很多肺腺癌或其前體病變的CT影像表現(xiàn)是持續(xù)存在的磨玻璃結(jié)節(jié)(ground glass nodule,GGN)[5]。據(jù)2015版世衛(wèi)組織(WHO)分類,肺腺癌包含浸潤前病變——非典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinoma in situ,AIS),微浸潤性腺癌(minimally invasive adenocarcinoma,MIA)及浸潤性腺癌(invasive adenocarcinoma,IAC)[6]。針對不同的病理亞型,患者的手術(shù)方式和5年無病生存率(disease free survival,DFS)明顯不同,IAC患者較非IAC(包括AAH、AIS和MIA)患者需要更大范圍的肺組織切除術(shù)且5年DFS顯著降低[7-9]。因此通過無創(chuàng)的CT影像預(yù)測肺腺癌浸潤性能為臨床醫(yī)師制定最優(yōu)治療方案提供更全面的參考依據(jù)。近年來人工智能(artificial intelligence,AI)的快速發(fā)展能夠利用CT影像鑒別IAC和非IAC,主要通過CT影像組學和深度學習(deep learning,DL)兩種方法實現(xiàn)[10]。目前基于此兩種方法區(qū)分IAC和非IAC的研究已有不少,但是不同研究間的樣本量、研究質(zhì)量及AI算法的差異卻使得AI診斷的性能參差不齊。因此,本文對基于AI的CT影像預(yù)測肺腺癌浸潤性的能力進行了Meta分析,旨在為其臨床應(yīng)用提供更有力的支撐。

材料與方法

1.文獻檢索策略

檢索數(shù)據(jù)庫:PubMed、Embase、Cochrane圖書館、Web of Science、中國知網(wǎng)(CNKI)、SinoMed (CBM)、萬方和維普等在線數(shù)據(jù)庫。文獻發(fā)表時間:2011年1月1日-2021年6月30日。檢索內(nèi)容:國內(nèi)外公開發(fā)表的基于AI的CT影像預(yù)測肺腺癌浸潤性的所有文章。中文檢索關(guān)鍵詞包括:肺結(jié)節(jié)、磨玻璃結(jié)節(jié)、純磨玻璃結(jié)節(jié)、亞實性結(jié)節(jié)、混雜磨玻璃結(jié)節(jié)、腺癌、肺癌、CT、計算機斷層掃描、人工智能、深度學習、機器學習、神經(jīng)網(wǎng)絡(luò)、隨機森林、支持向量機、電腦輔助診斷、病理、浸潤、分類、識別、預(yù)測等;英文檢索關(guān)鍵詞包括:pulmonary nodule,ground glass nodule,pure ground glass nodule,mixed ground glass nodule,subsolid nodule,adenocarcinoma,lung cancer,CT,computed tomography,AI,deep learning,machine learning,computer-aided diagnosis,neural network,random forest,support vector machine,pathology,invasive,classify,predict等。此外,還包括這些詞的同義詞或近義詞,如部分實性結(jié)節(jié),非實性結(jié)節(jié),肺部腫瘤,part-solid nodule,non-solid nodule,lung nodule,lung neoplasm等。

2.納入與排除標準

檢索的文章使用Endnote 9軟件管理。納入標準:①以漢語或英語公開發(fā)表的文獻;②以CT為影像檢查方法,通過AI進行診斷并取得診斷結(jié)果的患者;③以病理學檢查結(jié)果為肺腺癌(WHO 2015版)為金標準,納入的病理亞型包括IAC、MIA、AIS和AAH;④病灶直徑≤3 cm。排除標準包括:①重復(fù)發(fā)表的文獻;②無法獲取全文、數(shù)據(jù)不完整或研究內(nèi)容不同;③病變直徑>3 cm或?qū)Σ∽兇笮∥醋鞒稣f明;④其他類型的肺癌或良性病變;⑤文章類型為綜述、Meta分析、動物實驗、會議、通信、述評等。

3.納入文獻質(zhì)量評價

QUADAS-2診斷準確性試驗質(zhì)量評價工具用于文獻質(zhì)量評判[11]。先由3位研究人員(分別有1年、3年和5年影像診斷工作經(jīng)驗)獨自進行預(yù)評估,然后由專家組(由3位有15年以上影像診斷工作經(jīng)驗的醫(yī)生組成)匯總評估結(jié)果作出最終決定。評估主要包含“偏倚風險判斷”和“臨床適用性評價”兩部分。前者從病例選擇、待評價試驗、金標準、病例流程和進展狀況四個方面進行評判,分為“是”、“否”、“不清楚”三級;后者主要判斷病例選擇、待評價試驗、金標準與待評價項目的匹配程度,分為“高”、“低”、“不清楚”三級。

4.數(shù)據(jù)提取

先由2位研究人員提取數(shù)據(jù),再由另1位研究人員完成核對。當產(chǎn)生不同意見時,交由專家組討論并作出最終決定。提取的內(nèi)容包括:①一般特征:第一作者、出版年份、資料來源、患者總數(shù)、性別、肺結(jié)節(jié)總數(shù)、結(jié)節(jié)類型和病理類型(IAC/非IAC)。②診斷特征:AI算法/模型、提取特征、樣本分組、模型分組;以IAC為陽性結(jié)果,非IAC為陰性結(jié)果,直接提取或經(jīng)計算得出真陽性(true positive,TP)、假陽性(false positive,F(xiàn)P)、假陰性(false negative,F(xiàn)N)和真陰性(true negative,TN)的樣本量,以金標準為參照組成四格表數(shù)據(jù)。此外,納入研究一般將數(shù)據(jù)分為訓(xùn)練組和測試組兩部分,前者用于對AI診斷模型進行訓(xùn)練,后者用于最終模型的性能檢驗。因此,本Meta分析僅提取測試組的數(shù)據(jù)。

圖1 文獻篩選流程圖。

5.統(tǒng)計分析

統(tǒng)計分析軟件包括RevMan 5.3、MetaDiSc 1.4和Stata16.0。RevMan 5.3用于繪制風險偏倚評價的條形圖。MetaDiSc 1.4用于檢測閾值效應(yīng)、異質(zhì)性分析、合并指標的計算以及亞組分析。閾值效應(yīng)引起的異質(zhì)性使用敏感度對數(shù)與(1-特異度)對數(shù)之間的Spearman相關(guān)系數(shù)進行檢測;非閾值效應(yīng)引起的異質(zhì)性使用Cochran-Q及I2檢驗進行檢測。組間異質(zhì)性較低時(I2<50%),采用固定效應(yīng)模型合并指標;組間異質(zhì)性較高時(I2≥50%),采用隨機效應(yīng)模型合并指標。評價指標包含:合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,PLR合并)、合并陰性似然比(pooled negative likelihood ratio,NLR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)、集成受試者操作特征(summary receiver operating characteristic,SROC)曲線以及曲線下面積(area under curve,AUC),其中DOR合并是主要合并指標。亞組分析依照研究對象的特點分組,通過Meta回歸判斷異質(zhì)性來源,繪制各組的SROC曲線并得到AUC值,計算各組的Sen合并、Spe合并、DOR合并。Stata16.0用于敏感性分析和發(fā)表偏倚檢驗。分別剔除敏感性分析篩出的高敏數(shù)據(jù),重新繪制SROC曲線并比較AUC值來驗證AI診斷性能的穩(wěn)定性。Deeks檢驗用于評估發(fā)表偏倚。以P<0.05為差異有統(tǒng)計學意義。

結(jié) 果

1.納入文獻概述

通過檢索共獲得文獻1207篇,12篇文獻(中文4篇,英文8篇)進入最終的分析[12-23]。文獻篩選流程見圖1,文獻質(zhì)量評價結(jié)果見圖2。納入文獻的一般特征和診斷特征分別見表1和表2,共納入4066例患者的4325枚肺結(jié)節(jié),訓(xùn)練組和測試組的結(jié)節(jié)數(shù)分別為3144枚和1181枚,共提取了34組四格表數(shù)據(jù)。在性別構(gòu)成上,10篇文獻根據(jù)患者總數(shù)列出,其中男性1079人,女性2207人;另有2篇根據(jù)結(jié)節(jié)總數(shù)列出,其中男性肺結(jié)節(jié)297枚,女性肺結(jié)節(jié)526枚。有10篇文獻詳細說明了結(jié)節(jié)類型,包括2979枚純磨玻璃結(jié)節(jié)(pure ground glass nodules,pGGN)、797枚混雜磨玻璃結(jié)節(jié)(mixed ground glass nodules,mGGN)和113枚實性結(jié)節(jié);其余2篇僅指出結(jié)節(jié)類型為GGN,共436枚。

2.Meta分析結(jié)果

閾值效應(yīng)和異質(zhì)性檢驗:Spearman相關(guān)系數(shù)為0.154(P=0.386>0.05),意味著本研究不存在閾值效應(yīng)。DOR合并的Cochran-Q檢驗得出Cochran-Q=79.09(P<0.001),說明有非閾值效應(yīng)造成的異質(zhì)性;且Sen合并、Spe合并、PLR合并、NLR合并、DOR合并的I2值分別為71.6%、72.5%、71.7%、66.4%、58.3%,I2均>50%,進一步說明了較高異質(zhì)性的存在,故各指標需采取隨機效應(yīng)模型合并。

各指標合并結(jié)果:AI模型的Sen合并=0.86[95%置信區(qū)間(95%CI):0.85~0.88)],Spe合并=0.82(95%CI:0.80~0.84),PLR合并=4.55(95%CI:3.61~5.75),NLR合并=0.19(95%CI:0.15~0.23),DOR合并=28.31(95%CI:19.76~40.54),總體AUC為 0.9110(圖3~6)。

表1 納入研究的一般特征

圖2 納入文獻質(zhì)量評估結(jié)果(QUADAS-2)。

亞組分析:依據(jù)不同的AI算法將34組數(shù)據(jù)分成3類,分別為隨機森林(random forest,RF)14組、支持向量機(support vector machine,SVM)7組以及“其他”(Others)13組;依據(jù)測試組樣本數(shù)量是否≥50例分成2類(是:26組;否:8組)。基于此兩種分類進行Meta回歸,分析顯示AI算法的差異(P=0.0028)或許是產(chǎn)生異質(zhì)性的原因之一,樣本量的差異(P=0.2761)無法作為異質(zhì)性來源的依據(jù)。重新合并按不同算法分組的各項指標(表3),RF組的Sen合并(0.91)、DOR合并(52.91)和AUC(0.9412)最高,而Others組的Spe合并(0.84)最高。

敏感性分析和發(fā)表偏倚:圖7顯示第12、13和28組數(shù)據(jù)存在較強敏感性,分別剔除這3組數(shù)據(jù)后的AUC為0.9077、0.9074和0.9138,全部剔除這3組數(shù)據(jù)后的AUC為0.9063,該結(jié)果與總體AUC(0.9110)差別不大,說明此次Meta分析敏感性較低,結(jié)果穩(wěn)定可靠。Deeks偏倚檢驗結(jié)果顯示P=0.06>0.05,表明漏斗圖基于回歸線對稱,無發(fā)表偏倚。

討 論

隨著AI在醫(yī)學領(lǐng)域應(yīng)用的不斷深化和細分,在肺腺癌診斷方面,基于影像組學和AI的良惡性鑒別、惡性程度分級等研究已廣泛開展[24]。然而,由于組學模型泛化不易,紋理特征的魯棒性不同,DL又需要比組學模型更多的樣本用于訓(xùn)練,導(dǎo)致不同研究間的AI診斷性能差異顯著[25-26]。GGN作為初期肺腺癌的首要影像表現(xiàn),AI對其浸潤性的預(yù)測同樣受上述因素制約,所以本文對基于不同AI算法的CT影像預(yù)測肺腺癌浸潤性的診斷能力進行Meta分析。最終納入12項研究的4325枚肺結(jié)節(jié),其中絕大多數(shù)(97%,4212/4325)為GGN。此外,無論是按患者數(shù)還是按結(jié)節(jié)數(shù)統(tǒng)計,女性均占大多數(shù),分別為67%(2207/3286)和64%(526/823),與文獻報道的近年顯著升高的女性肺腺癌發(fā)病率相符[27]。

表2 納入研究的診斷特征

表3 各亞組合并結(jié)果

本次分析無閾值效應(yīng),但研究間異質(zhì)性較高,故對各指標使用隨機效應(yīng)模型合并。DOR合并為主要合并指標,代表診斷試驗結(jié)果與疾病的關(guān)系水平;當DOR合并>1時,其值越大,該試驗的診斷能力就越高[28]。本文DOR合并=28.31,說明了AI對肺腺癌浸潤性較高的診斷性能。Sen合并、Spe合并分別為86%、82%,說明AI確定IAC和識別非IAC的能力都相對較高。PLR合并顯示AI正確識別IAC的概率是錯誤識別概率的4.55倍,NLR合并顯示錯誤識別非IAC的概率是正確識別概率的0.19倍。總體AUC為0.9110,也證明AI的診斷性能優(yōu)異。

根據(jù)Meta回歸結(jié)果,AI算法的差異可推斷為異質(zhì)性的來源。從表3可知,RF組的Sen合并、DOR合并和AUC均高于另外兩組,說明基于CT影像組學特征構(gòu)建的AI模型中,RF算法對IAC的診斷性能好于其他機器學習(machine Learning,ML)算法,可能代表了其更好的泛化能力。當然,RF的高診斷性能也不能排除是因為納入分析組數(shù)較多、代表性較強導(dǎo)致的結(jié)果。需要指出的是,這也不能說明ML要比DL的診斷性能更好;相反,使用基于DL的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)進行肺結(jié)節(jié)分類在多數(shù)場合下是優(yōu)于現(xiàn)有的計算機輔助診斷技術(shù)的[29-31],采用CNN對肺腺癌分類的研究也逐年增多,在診斷性能上已達到甚至略超過高年資放射科醫(yī)生的水平[32-34]。從本文看,僅有三組四格表數(shù)據(jù)是基于CNN算法的結(jié)果,因而在分組中被歸入了“其他”一組,且樣本量較少,均導(dǎo)致其診斷價值體現(xiàn)不足。此外,在文獻篩選過程中,部分無法提取四格表信息的基于DL的研究也被排除,同樣對其診斷價值的判斷存在影響。但是,本次亞組分析已證實了不同AI算法是引起異質(zhì)性的原因,而且最終SROC曲線的AUC為0.9110,排除較高敏感性數(shù)據(jù)后的AUC也都在此值附近輕微波動,顯示了綜合了ML和DL的AI在預(yù)測肺腺癌浸潤性的能力上的高效性和穩(wěn)定性。

圖3 a)AI模型的合并敏感度;b)合并特異度。

圖4 a)AI模型的合并陽性似然比;b)合并陰性似然比。

圖5 AI模型的合并診斷比值比。

圖6 AI模型的SROC曲線。 圖7 敏感性分析結(jié)果。

當前AI取得的成就固然可喜,但依然處在初步驗證和應(yīng)用階段,還有相當?shù)母倪M空間,需要與臨床醫(yī)生密切配合才能發(fā)揮其價值。如本文中,AI對肺腺癌浸潤性的診斷仍存在一定的漏診率和誤診率(分別為14%和18%),而對組學特征的進一步挖掘、擴大訓(xùn)練樣本量或進一步提升有限數(shù)據(jù)集上算法的性能都是可行的解決方法。這些工作都需要醫(yī)生工作的支持,其中放射科醫(yī)生在判斷新興AI技術(shù)的臨床應(yīng)用價值上有重要作用,并在整合互補成像技術(shù)信息與臨床數(shù)據(jù)的工作中擔任指導(dǎo)者角色,從而能提供更完善的診斷信息[26]。此外,即便AI已能獨立診斷,但最終仍需要放射科醫(yī)生簽發(fā)報告并承擔法律風險[35],因此,如果能通過立法明確醫(yī)生與提供AI服務(wù)的公司間各自的責任范圍,也能促進AI診斷服務(wù)的普及。最后,目前醫(yī)生對AI的積極態(tài)度也為二者的深度協(xié)同提供了有利前提[36]。

本文存在以下不足:①收集的是二分類數(shù)據(jù)(IAC與非IAC),其他二分類方法(如浸潤前病變和浸潤性病變)、多分類方法(如對IAC的病理亞型細分)以及包含了良性結(jié)節(jié)的分類方式均被排除,可能會對診斷價值的評判產(chǎn)生影響。但如前文所言,以IAC和非IAC進行區(qū)分更具有臨床意義,因而基于本文分類所得的診斷價值可能更具實用性。②因部分研究無法提取四格表數(shù)據(jù)或所含樣本量較少,其代表的算法的診斷價值可能無法被真實反映。③盡管Meta回歸顯示不同的AI算法是異質(zhì)性產(chǎn)生的原因,但是其他方面,如患者間的差異、CT設(shè)備或掃描協(xié)議的不一致、提取特征的數(shù)量差距或組學特征的不同等,都可能是出現(xiàn)異質(zhì)性的因素,有待深入研究。④僅納入了以中、英兩種語言發(fā)表的文章,其他語種的文獻或被漏掉而造成偏倚。

綜上所述,本Meta分析顯示基于AI的CT影像對肺腺癌浸潤性有較高的預(yù)測能力,能為臨床上制定隨訪策略或手術(shù)方案提供更詳細的參考依據(jù),具有實際應(yīng)用的價值。但AI診斷目前仍有一定的漏診率和誤診率,獲取更詳實的患者資料、采用結(jié)構(gòu)化的影像報告、收集多中心的大量樣本、深度挖掘紋理特征和優(yōu)化神經(jīng)網(wǎng)絡(luò)架構(gòu)等辦法將有助于進一步提升AI診斷工具的性能。同時,AI與醫(yī)生的深度協(xié)同能促進工作效率的提高,增加醫(yī)療資源利用率,為實現(xiàn)肺癌的早篩早診早治提供一條更科學高效的途徑。

猜你喜歡
浸潤性腺癌異質(zhì)性
Meta分析中的異質(zhì)性檢驗
特殊浸潤性表面構(gòu)建及其抑制酸奶黏附的研究
城市規(guī)模與主觀幸福感——基于認知主體異質(zhì)性的視角
云南地區(qū)多結(jié)節(jié)肺腺癌EGFR突變及其臨床意義
十二指腸腺癌88例臨床特征及相關(guān)預(yù)后因素
以盆腔巨大包塊就診的宮頸微偏腺癌2例報告
浸潤性乳腺癌的超聲診斷與臨床病理學對照分析
臨床常見革蘭陰性菌異質(zhì)性耐藥研究進展
基于可持續(xù)發(fā)展的異質(zhì)性債務(wù)治理與制度完善
同期經(jīng)尿道手術(shù)治療非肌層浸潤性膀胱癌(NMIBC)合并良性前列腺增生(BPH)患者的效果觀察