胡志宇,張曉琴
(1.內蒙古醫(yī)科大學研究生學院,內蒙古 呼和浩特;2.內蒙古自治區(qū)人民醫(yī)院,內蒙古 呼和浩特)
肺癌是全球癌癥死亡的主要原因,約占18.4%,一項以人群為基礎的篩查項目的結果顯示,肺癌導致的死亡人數超過了宮頸癌、乳腺癌和結直腸癌的總和[1]。肺癌患者的5年生存率只有15%,這是因為大約70%的患者在確診時病情已經惡化[2]。目前早期肺癌篩查的主要手段為低劑量螺旋CT(low-dose computed tomography,LDCT),Ⅰ期肺癌通過低劑量螺旋CT 篩查檢出后實施外科手術治療,其預期 10年生存率可達 88%[3],大型隨機對照試驗表明與X 線相比LDCT 可降低20%的肺癌死亡率[4-5]。因此肺癌的早期診斷與治療對患者生存率的提高顯得至關重要。早期肺癌的主要CT 表現為肺結節(jié),但是其檢出結果受到診斷醫(yī)師主觀影響較大,并且隨著工作量的逐漸增多,意味著缺乏經驗的低年資影像科醫(yī)師更容易漏診或誤診[6]。人工智能(artificial intelligence,AI)是現今非常受歡迎的話題,其在影像醫(yī)學診斷領域的研究應用深受矚目,其中基于深度學習的肺結節(jié)輔助診斷系統憑借其強大的學習及分析能力逐漸受到認可。本研究分析AI 肺結節(jié)篩查系統在臨床使用中對不同類型肺結節(jié)的檢出效能,探討其在臨床中的應用價值。
回 顧 性 收 集2018年12月1日 至2019年6月30日于內蒙古自治區(qū)人民醫(yī)院進行肺部檢查的117例患者為研究對象。其中男性患者51例(43.6%),女性患者66例(56.4%),年齡31~91歲,平均年齡(58.5±12.9)歲。納入標準:①符合《肺結節(jié)診治中國專家共識(2018年版)》相關診斷標準[7];② 所有患者均行低劑量螺旋CT 平掃檢查。排除標準:①直徑≤5mm 的肺結節(jié);②彌漫性分布的磨玻璃影;③既往肺結核患者;④其他部位惡性腫瘤患者。
1.2.1 影像學掃描
所有患者均使用德國SIEMENS 炫速雙源CT(SOMATOM Definition Flash)進行掃描?;颊呷⊙雠P位、頭先進,前臂舉頭上,深吸氣后屏氣開始掃描,掃描范圍為肺尖部到雙側膈肌底部,低劑量掃描參數[8]:管電壓為120KV,管電流≤40mAs,掃描層厚為5mm,圖像重建層厚為1.25mm。
1.2.2 閱片方法
本研究主要關注實性結節(jié)、磨玻璃結節(jié)和胸膜結節(jié)的檢出情況,因此首先由兩位擁有超過15年胸部CT 閱片經驗的放射科專家對所有CT 圖像進行雙盲法判讀,意見不統一時協商解決,針對以上三類肺結節(jié)共同制定本研究使用的金標準肺結節(jié)數。AI 閱片使用北京推想科技提供的InferRead CT 肺結節(jié)輔助診斷系統,該系統基于深度學習,以40 萬訓練數據集為基礎,數據庫的數據均來源于全國多家大型三甲醫(yī)院,系統能將疑似肺結節(jié)進行標記,下方欄目可顯示結節(jié)直徑、CT 值、結節(jié)性質(實行結節(jié)、GGN 或胸膜結節(jié))、結節(jié)征象(毛刺征、分葉征、胸膜凹陷征等)及惡性概率等信息。將所有患者的LDCT 圖像資料上傳至AI 系統進行不同性質結節(jié)的檢測,記錄其檢測到的相應類型肺結節(jié)數,然后與金標準進行對比,分析AI 系統檢測到的真陽性結節(jié)(TP),假陽性結節(jié)(FP)和假陰性結節(jié)(FN)的數量,計算AI 系統檢測不同結節(jié)的敏感性和假陽性率(FPs/Scan),進而對比其對不同類型結節(jié)檢出的效能情況。
1.2.3 統計學方法
采用SPSS 23.0 統計軟件對數據進行統計學分析。計量資料先進行正態(tài)性檢驗,符合正態(tài)分布的數據用(±s)表示,分類變量用頻率和百分比表示。率的比較采用χ2檢驗,P<0.05 認為差異具有統計學意義。
在入組的117例胸部CT 數據中共計標注了310個實性結節(jié),147個磨玻璃結節(jié)和50個胸膜結節(jié)作為本研究的金標準。AI 肺結節(jié)篩查系統檢測到626個實性結節(jié),包含270個真陽性實性結節(jié),檢測敏感性為87.1%。同時AI 系統檢測到356個磨玻璃結節(jié),包括133個真陽性磨玻璃結節(jié),檢測敏感性為90.48%。對于胸膜結節(jié)而言,AI 系統共計檢測到89個,其中43個為真陽性胸膜結節(jié),檢測敏感性為86%。AI 系統對三種不同類型的結節(jié)檢出敏感性無顯著差異(P>0.05)。此外,AI系統檢測實性結節(jié)、磨玻璃結節(jié)和胸膜結節(jié)的假陽性率分別為3.04 FPs/Scan、1.91 FPs/Scan 和0.39 FPs/Scan。
由于人口老齡化、環(huán)境污染加劇、慢性感染無法控制、普遍存在的西方化生活模式(包括吸煙和有害飲酒、不健康飲食和缺乏體育活動等)以及遺傳等多方面因素影響,我國肺癌的發(fā)病率和死亡率呈逐年上升趨勢。肺癌已經成為我國乃至全世界范圍因癌癥死亡最主要的原因[9-10]。相對于其他癌癥,肺癌的生物學特征較為復雜,早期較少出現臨床癥狀,約70%~80%的患者直到中晚期出現臨床癥狀時才來就診,這已經錯過了最佳的手術時機[11],III 期后肺癌的5年生存率低于20%。但有相關研究表明,確診的I 期肺癌經過手術治療后的5年生存率超過90%[12]。早期精準的檢出肺癌對指導患者治療、改善預后等具有非常重要的意義。早期肺癌的主要表現為肺內結節(jié),因此肺癌的早期篩查主要從肺結節(jié)入手。目前,CT 是肺結節(jié)檢出最有效的技術手段,LDCT 及CT 薄層技術的廣泛應用使CT 肺結節(jié)篩查成為一種常規(guī)檢查手段。一般而言,一例CT 薄層掃描包含數百張圖像,明顯增多的CT 數據需要耗費影像科醫(yī)生相當長的時間進行診斷,僅憑醫(yī)生肉眼觀察,檢出準確率不穩(wěn)定,尤其對于缺乏經驗的低年資醫(yī)生,容易產生漏診和誤診,有研究報道影像科醫(yī)師雙閱片情況下肺結節(jié)檢出率僅為59.1%[13]。隨著人工智能(AI)的迅速發(fā)展,其高效與便捷的特點給醫(yī)療行業(yè)尤其是以大數據為基礎的醫(yī)學影像領域帶來了新的前景。人工智能已在心臟血管病變、乳腺腫瘤的診斷中有較好的表現[14-15],近年來AI 在肺結節(jié)篩查中也有較廣泛的應用。
人工智能是計算機科學的一個分支,專注于計算機算法的開發(fā),以完成傳統上與人類智能相關的任務,比如學習和解決部分問題的能力。機器學習(Machine learning,ML)是人工智能研究的一部分,側重于計算機算法的開發(fā),沒有明確的決策規(guī)則編碼。ML 經常被細分為監(jiān)督學習和非監(jiān)督學習。在監(jiān)督學習中,需要給出用于算法開發(fā)的注釋數據(“groundtruth”data)。在非監(jiān)督學習中,提供給系統未標記的數據,系統必須自己進行分類[16]。深度學習(Deep learning)是機器學習的一個子集,其中深度卷積神經網絡(CNNs)是DL 中最熱門的一個研究,它采用基于多層神經網絡的算法結構,這種技術的強大之處在于它的可拓展性和神經網絡構架從數據中提取自身相關特征的能力,而不需要輸入任何方向標記的數據[17]。本研究所采用的肺結節(jié)篩查軟件就是基于卷積神經網絡利用深度學習進行目標檢測。CNNs 在2012年ImageNet 比賽中取得最終勝利,此后以CNNs 為代表的深度學習在數據分析方面呈現了迅速的發(fā)展趨勢[18],并在影像醫(yī)學廣泛應用?;诖笠?guī)模訓練神經網絡,多用于模式分類、圖像分割、目標檢測、圖像減噪等。有學者使用該算法進行肺結節(jié)檢出,其檢出敏感度為80.3%,假陽性率為4.8 FPs/Scan[19]。
表1 不同類型結節(jié)檢出情況統計表
本次實驗中AI 篩查不同類型的肺結節(jié)總體假陽性率稍高,主要是對于小葉中心結構的誤診,導致誤診的其他原因主要有:①小葉間隔以及小葉內間隔的異常增厚;②擴張的細支氣管,支氣管及細支氣管內的粘液栓;③迂曲、增粗的肺血管,增粗的肺門血管;④條索、樹芽征、局限性肺不張等各時期的感染性病變;⑤胸膜斑塊、凸向肺內的局限性骨結構。導致假陽性的原因可能與AI 預設的分類閾值較低有關?,F階段AI 學習的重點還是對于陽性結節(jié)的認知,對于假陽性結節(jié)的學習還比較欠缺?;谏疃葘W習的AI 系統具有較快的學習速度,通過不斷的積累經驗以及模型的不斷升級,其診斷的敏感性與特異性也會不斷提升,假陽性也會得到控制。
本研究的局限性在于實驗的樣本量尚不夠,并且是基于回顧性的病例選取,均為醫(yī)師發(fā)現的陽性病例,而臨床中漏診的病例無法獲得,因此存在一定的選擇性偏移。目前AI 技術仍然處于深度開發(fā)階段,還不能直接作為檢查診斷方式,得出的結果還需醫(yī)生進行判斷審核。但AI 技術在病灶檢出率以及檢出耗時等方面所展現的優(yōu)勢是有目共睹的。
綜上所述,AI 肺結節(jié)篩查系統在臨床使用中對不同類型結節(jié)均表現出較高敏感性,可以全面有效的輔助臨床肺結節(jié)篩查工作,對于肺結節(jié)早期篩查有具有非常重要的意義。相信隨著AI 技術的不斷發(fā)展,人工智能在影像診斷領域將發(fā)揮出更重要的作用。