張力,肖丹丹
1.北京中醫(yī)醫(yī)院順義醫(yī)院醫(yī)學(xué)工程處,北京 101300;2.北京中醫(yī)醫(yī)院順義醫(yī)院放射科,北京 101300; *通信作者 張力z_z200888@126.com
在全球范圍內(nèi),肺癌的發(fā)病率和死亡率高,并呈年輕化趨勢(shì),且較多患者發(fā)現(xiàn)時(shí)已處于進(jìn)展期,其5年生存率僅為19%,早診早治是提高肺癌生存的關(guān)鍵[1-2]。早期肺癌在胸部CT主要表現(xiàn)為肺小結(jié)節(jié),雖然其檢出率逐年提高,但假陽(yáng)性率較高,導(dǎo)致目前肺結(jié)節(jié)良惡性鑒別診斷存在困難,微小結(jié)節(jié)的診斷更具挑戰(zhàn)[3-5]。
非小細(xì)胞肺癌約70%為肺腺癌,肺腺癌及浸潤(rùn)前病變分為不典型腺瘤樣增生(atypical adenocarcinoma hyperplasia,AAH)、原位腺癌(adenocarcinomain situ,AIS)、微浸潤(rùn)腺癌(microinvasive adenocarcinoma,MIA)和浸潤(rùn)性腺癌(invasive adenocarcinoma,IAC)[6]。不同類型的治療方式不同,患者預(yù)后生存有差別,因此在CT上準(zhǔn)確判斷肺腺癌亞型的臨床意義重大[2,5-6]。
人工智能時(shí)代,各種分類器可有效鑒別結(jié)節(jié)的良惡性,輔助醫(yī)師提高診斷效率的同時(shí),也減少了讀片者的主觀偏差,對(duì)肺結(jié)節(jié)的定性診斷可無(wú)創(chuàng)地量化腫瘤表型特征,降低過度診斷,緩解患者的壓力[1,7-11]。
大量影像組學(xué)和深度學(xué)習(xí)在肺結(jié)節(jié)診斷方面的研究充分證明了這種高度定量技術(shù)手段的有效性[12-16],目前在肺結(jié)節(jié)的鑒別診斷、病理分型甚至分子分型方面有大量研究[12,15,17-18],但對(duì)不同模型在不同類型結(jié)節(jié)判斷能力的表現(xiàn)鮮有報(bào)道,現(xiàn)有的研究無(wú)法綜合評(píng)估不同組學(xué)模型的優(yōu)缺點(diǎn),也限制了其在臨床上的應(yīng)用[9,11,16,18]。本研究創(chuàng)新性地引入雙影像組學(xué)模型——針對(duì)不同大小類型的實(shí)性和亞實(shí)性肺結(jié)節(jié),從良惡性分類以及侵襲程度分級(jí)方面對(duì)模型進(jìn)行評(píng)估。希望推進(jìn)個(gè)性化醫(yī)療進(jìn)步,精準(zhǔn)指導(dǎo)臨床實(shí)踐,并在模型表現(xiàn)不佳的區(qū)間給出可信度提醒。
1.1 研究對(duì)象 回顧性分析2015年1月—2019年9月于北京中醫(yī)醫(yī)院順義醫(yī)院行CT胸部平掃肺結(jié)節(jié)的875個(gè)病例,共包含4 892個(gè)肺結(jié)節(jié),依據(jù)病灶體積分布分為小、中、大結(jié)節(jié)組,小結(jié)節(jié)組為體積小于下四分位數(shù)(51.63 mm3)的小病灶,大結(jié)節(jié)組是體積大于上四分位數(shù)(434.75 mm3)的大病灶,介于兩者之間為中結(jié)節(jié)組。若以球形計(jì)算結(jié)節(jié)的直徑,則對(duì)應(yīng)分組標(biāo)準(zhǔn)分別是下四分位數(shù)4.6 mm(51.63 mm3)和上四分位數(shù)9.4 mm(434.75 mm3)。
1.2 數(shù)據(jù)采集方式 患者取仰臥位,雙上肢過頭伸展,屏氣訓(xùn)練,以吸氣末期行胸部CT平掃。以上影像數(shù)據(jù)采集均采用西門子Defintion AS/YSIO CT設(shè)備,掃描參數(shù)為電壓120 kV,轉(zhuǎn)速0.5 s/r,電流110 mAs,層厚3 mm,螺距1.2 mm。CT掃描數(shù)據(jù)采用0.6 mm圖像層厚及Lung算法重建,重建范圍包括雙側(cè)鎖骨上線至雙側(cè)膈肌下緣。
1.3 病灶分割 圖像數(shù)據(jù)采集完成后,先進(jìn)行圖像預(yù)處理,按照CT肺窗將圖像的灰度值進(jìn)行截?cái)嗵幚?,線性變換至1~4 097。然后由2位具有10年以上工作經(jīng)驗(yàn)的副主任醫(yī)師在達(dá)爾文智能科研平臺(tái)采用盲法手動(dòng)逐層勾畫共4 892個(gè)結(jié)節(jié)的感興趣區(qū)(ROI),并標(biāo)注良惡性及浸潤(rùn)性(其中2 014個(gè)結(jié)節(jié)有病理惡性確診結(jié)果,為模型2所用),后續(xù)統(tǒng)計(jì)分析以醫(yī)師組標(biāo)注結(jié)果為正確結(jié)果(金標(biāo)準(zhǔn))進(jìn)行對(duì)比分析。
1.4 模型建立 肺結(jié)節(jié)良惡性分類模型(模型1)的建立用3 669個(gè)結(jié)節(jié)作為訓(xùn)練集,1 223個(gè)結(jié)節(jié)作為測(cè)試集,訓(xùn)練集中小、中、大結(jié)節(jié)組分別有901、1 841、927個(gè)病灶,測(cè)試集中3組分別有299、601、323個(gè)病灶。
首先進(jìn)行特征提取,每一種特征均由一個(gè)濾波器函數(shù)和一類特征組合而成,其中包含8種濾波器:指數(shù)濾波器、拉普拉斯-高斯濾波器、平方濾波器、平方根濾波器、對(duì)數(shù)濾波器、梯度值濾波器、局域二值圖模式圖、小波變換濾波器。特征包含7大類:一階特征、形狀特征(3D)、灰度共生矩陣、灰度區(qū)域大小矩陣、灰度游程矩陣、相鄰灰度差矩陣、灰度依賴矩陣。經(jīng)過濾波器和特征的排列組合,每個(gè)病灶或ROI能計(jì)算得到1 223維。然后對(duì)所有特征按照公式(1)進(jìn)行歸一化預(yù)處理。
其中n和j分別代表第n個(gè)樣本的第j個(gè)特征。xmin,j是在所有樣本中,第j個(gè)特征最小的那個(gè)樣本,同理xmax,j為特征值最大的樣本。
預(yù)處理完成后,通過包裹式特征篩選方式中的遞歸特征消除方法,利用邏輯回歸連續(xù)建模選擇特征,逐次刪除最不重要的特征,最后保留10個(gè)特征作為模型的輸入,在達(dá)爾文智能科研平臺(tái)利用以徑向基函數(shù)為核的支持向量機(jī)模型分別建立肺結(jié)節(jié)良惡性鑒別(模型1)和浸潤(rùn)性分類模型(模型2)。并對(duì)錯(cuò)誤樣本進(jìn)行懲罰,懲罰系數(shù)C=100。
模型2則將模型1中確診惡性結(jié)節(jié)中屬于腺癌的部分進(jìn)一步細(xì)分,預(yù)測(cè)腺癌亞型(共2 014個(gè)結(jié)節(jié)病理確診惡性,其中1 978個(gè)結(jié)節(jié)為腺癌,25例為鱗癌,11例為其他),根據(jù)浸潤(rùn)程度預(yù)測(cè)輸出值分為3類,分別為浸潤(rùn)前病變(AAH+AIS)、MIA和IAC。
模型建立后選取0.5作為參考閾值,計(jì)算2個(gè)模型在各種條件下的準(zhǔn)確率,對(duì)模型表現(xiàn)進(jìn)行評(píng)估。其中陽(yáng)性在模型中代表惡性結(jié)節(jié)(n),陰性代表良性結(jié)節(jié),真陽(yáng)性率(%)=真陽(yáng)性/(真陽(yáng)性+假陰性),假陽(yáng)性率(%)=真陰性/(真陰性+假陽(yáng)性)。
本研究采用的基本流程見圖1。
圖1 研究流程圖。模型1和模型2的建立研究都分為基于4個(gè)基本階段,分別是圖像獲取、ROI分割、提取特征和分析
1.5 模型效能評(píng)估 肺結(jié)節(jié)直徑及體積以均數(shù)表示,模型1、2分別鑒別肺結(jié)節(jié)良惡性及浸潤(rùn)性的表現(xiàn)用準(zhǔn)確率、受試者工作特征(ROC)曲線下面積(AUC)評(píng)估。AUC是評(píng)價(jià)分類器性能的最佳度量之一。整個(gè)測(cè)試集與驗(yàn)證集比例為3∶1,測(cè)試集各項(xiàng)特征數(shù)據(jù)與驗(yàn)證集比例一致。模型2評(píng)估中使用熱圖,可以直觀表現(xiàn)不同病灶大小和浸潤(rùn)性水平關(guān)系的預(yù)測(cè)準(zhǔn)確率。
2.1 肺結(jié)節(jié)良惡性分類模型(模型1)表現(xiàn)評(píng)估 胸部CT病灶的良惡性分類模型(模型1)的分類ROC曲線見圖2。訓(xùn)練集和測(cè)試集的表現(xiàn)非常接近,訓(xùn)練集AUC為0.953(95%CI0.948~0.959),測(cè)試集AUC為0.950(95%CI0.938~0.961)。結(jié)果無(wú)過擬合,置信區(qū)間非常狹窄,模型可信度很高。為了進(jìn)行更加全面的統(tǒng)計(jì)分析,在后續(xù)研究中,利用訓(xùn)練集和測(cè)試集的全部數(shù)據(jù),并且設(shè)置總體預(yù)測(cè)閾值為0.5,在此閾值水平下訓(xùn)練集敏感度為0.82,特異度為0.914;測(cè)試集敏感度為0.852,特異度為0.912。
圖2 模型1在訓(xùn)練集和測(cè)試集上的ROC曲線
進(jìn)一步評(píng)估模型1對(duì)惡性病灶檢出的敏感度和特異度(圖3)顯示,在小結(jié)節(jié)組中良性病灶占99.0%(296/299),且良性病灶分類準(zhǔn)確率達(dá)100%;大結(jié)節(jié)組中則相反,惡性病灶(n=274)的準(zhǔn)確率達(dá)0.98,在良性病灶(n=49)鑒別準(zhǔn)確率為0.24,在中結(jié)節(jié)組中良性病灶占77.7%(467/601)且分類效果更好(準(zhǔn)確率為0.93)。
圖3 模型1在不同病灶大小和病灶類型下的準(zhǔn)確率。A為模型1不同病灶大小時(shí)鑒別良、惡性病灶的準(zhǔn)確率,B為熱力圖,進(jìn)一步展示了不同病灶大小數(shù)量和分類結(jié)果,其中每一塊中間數(shù)字為準(zhǔn)確率,下方數(shù)字代表該病灶類型包含的結(jié)節(jié)數(shù)量(n),色塊由淺到深代表分類準(zhǔn)確率由低到高,小、中、大分別為體積大小劃分的組別
2.2 腺癌浸潤(rùn)性預(yù)測(cè)模型(模型2)表現(xiàn)評(píng)估 模型對(duì)良性小結(jié)節(jié)和IAC的準(zhǔn)確率分別為100%和96.13%(圖4A)。大結(jié)節(jié)組中的良性病灶數(shù)量?jī)H49個(gè),占總體良性病灶的6%,總體惡性可能性很高。直徑>9.4 mm的大結(jié)節(jié)很容易與惡性病灶混淆,模型2則對(duì)這樣的大結(jié)節(jié)鑒別有很高的敏感度,其對(duì)浸潤(rùn)前(AAH+AIS)、MIA及IAC,模型準(zhǔn)確率分別為92%、94%、100%(圖4B)。對(duì)于4.6 mm≤直徑<9.4 mm的中間體積病灶,分類準(zhǔn)確率達(dá)93%,在浸潤(rùn)程度由低到高預(yù)測(cè)準(zhǔn)確度分別為0.33、0.61及0.42。
圖4 模型2在測(cè)試集上的表現(xiàn)。A中分別將良性結(jié)節(jié)和惡性結(jié)節(jié)按體積大小和病理亞型分為小、中、大3類,及AAH+AIS、MIA和IAC組。模型對(duì)良性小結(jié)節(jié)和惡性浸潤(rùn)型病變(IAC)的檢出最敏感;B中熱力圖將所有病灶按照病理分型和大小進(jìn)行二維分組,給出了對(duì)每一分組的預(yù)測(cè)準(zhǔn)確率。其中每一塊中間數(shù)字為準(zhǔn)確率,下方數(shù)字代表該病灶類型包含的結(jié)節(jié)數(shù)量(n),色塊由淺到深代表預(yù)測(cè)準(zhǔn)確率由低到高。浸潤(rùn)前病灶包括AAH與AIS,微浸潤(rùn)病灶為MIA,浸潤(rùn)性病灶為IAC
模型2預(yù)測(cè)腺癌分型結(jié)果見圖5。浸潤(rùn)型病變中大病灶占比>95%,準(zhǔn)確率達(dá)93%。預(yù)后較好的浸潤(rùn)前和微浸潤(rùn)病變(AAH、AIS、MIA)的中體積病灶占67%,準(zhǔn)確率接近100%,總體準(zhǔn)確率達(dá)93%。模型1、2輸出結(jié)果及精確度見圖6。
圖5 模型2在測(cè)試集上的總體表現(xiàn)。熱力圖中將所有病灶按照病理分型和大小進(jìn)行二維分組,給出了對(duì)每一分組的預(yù)測(cè)準(zhǔn)確率
圖6 模型1和2輸出結(jié)果及精確度。圖為在各種情況下模型1和模型2輸出結(jié)果的精確度示例。其中,“輸入”為病灶勾畫后提取的病灶大小,“輸出”為模型1和2的分類結(jié)果及針對(duì)不同輸出結(jié)果的精確度,其中紅色字體表示惡性可信度,綠色字體表示良性可信度,其他情況為空,需要醫(yī)師進(jìn)一步結(jié)合其他信息判斷其性質(zhì)
影像學(xué)征象在肺結(jié)節(jié)的診斷及評(píng)估中具有極其重要的意義。本研究建立的模型1對(duì)體積>434.75 mm3(直徑9.4 mm)的結(jié)節(jié)判斷為惡性的準(zhǔn)確率為92%,對(duì)所有大小結(jié)節(jié)在內(nèi)的IAC判斷為惡性的準(zhǔn)確率為96.13%,對(duì)病灶體積>51.63 mm3(直徑4.6 mm)的IAC的判斷準(zhǔn)確率為100%。
不同級(jí)別浸潤(rùn)性病變的生存和預(yù)后完全不同,從模型2的表現(xiàn)來看,浸潤(rùn)性肺癌的檢出率同樣高達(dá)97%,結(jié)合2個(gè)模型的表現(xiàn),本研究提出醫(yī)師聯(lián)合影像組學(xué)的診斷流程,該流程給出了在不同病灶大小下,模型輸出結(jié)果的精確度(可信度),當(dāng)2個(gè)模型同時(shí)輸出陽(yáng)性結(jié)果時(shí),該病灶是IAC的可能性非常大。若模型對(duì)中體積病灶給出AAH、AIS的預(yù)測(cè),建議隨訪觀察,給出MIA的預(yù)測(cè),結(jié)合組織病理檢查制訂切除方案;若本身為大病灶,模型給出IAC的預(yù)測(cè),則浸潤(rùn)性的可能性非常大,建議進(jìn)一步行組織病理檢查。
對(duì)于手術(shù)指征不明確的較大磨玻璃病灶,需要進(jìn)行大量的輔助類檢查。而PET/CT掃描對(duì)實(shí)性成分不高的磨玻璃病變并不敏感,當(dāng)病灶部位恰好難以行支氣管鏡檢查或穿刺活檢等病理檢查時(shí),臨床可考慮行影像組學(xué)模型的良惡性分類進(jìn)行參考,以進(jìn)一步明確手術(shù)指征。
本研究通過對(duì)肺結(jié)節(jié)良惡性模型和浸潤(rùn)型病理分型模型評(píng)估,可以看出在不同病灶大小下模型的表現(xiàn)不同。模型對(duì)小病灶和大病灶有更高的敏感度,基本上可以做到不漏診。對(duì)所有病灶的浸潤(rùn)類型判斷均能達(dá)到較高的準(zhǔn)確度,對(duì)微浸潤(rùn)型和浸潤(rùn)性病灶判斷無(wú)顯著差異。但是對(duì)于4.6 mm≤直徑<9.4 mm的中間體積病灶的準(zhǔn)確率不太高,建議位于該范圍的病灶可以通過隨訪并結(jié)合組織病理等指標(biāo)進(jìn)一步確診。
從模型的表現(xiàn)可認(rèn)為達(dá)爾文智能科研平臺(tái)的組學(xué)模型有敏銳的特征提取與識(shí)別能力,結(jié)果可信度很高。本研究基于雙模型組學(xué)模型提出了一個(gè)AI聯(lián)合放射科醫(yī)師的診斷肺結(jié)節(jié)的最佳流程,為直徑<1 cm的肺結(jié)節(jié)性質(zhì)判斷提供了可靠的參考,并對(duì)每一種可能情況給出了可信度提醒,方便臨床醫(yī)師結(jié)合實(shí)際出具診斷意見,有助于實(shí)現(xiàn)肺癌的早期診斷。
本研究的局限性:①本研究是一項(xiàng)回顧性研究,可能存在選擇偏倚;②盡管本研究中的模型在一致性和可重復(fù)性方面表現(xiàn)優(yōu)秀,但僅在內(nèi)部進(jìn)行了驗(yàn)證,設(shè)計(jì)時(shí)未納入外部驗(yàn)證,需要在外部數(shù)據(jù)集上驗(yàn)證模型表現(xiàn)并及時(shí)調(diào)整;③未來也需要多中心前瞻性試驗(yàn)進(jìn)一步驗(yàn)證,有望給出Lung-RADS分級(jí),精準(zhǔn)助力臨床實(shí)踐。