李健維,楊 昭,王小雷,張書海,謝宗玉
肺癌是全球癌癥相關死亡的主要原因[1],非小細胞肺癌(nonsmall-cell lung cancer,NSCLC)最常見的基因突變是表皮生長因子受體(epidermal growth factor receptor,EGFR)突變[2]。與野生型EGFR病人相比,酪氨酸激酶抑制劑(tyrosine kinase inhibitors,TKIs)對EGFR突變病人有著更高的應答率[3],能夠提高病人的無進展生存期[4],改善生活質(zhì)量,因此TKIs被美國國家綜合癌癥網(wǎng)絡(national comprehensive cancer network,NCCN)推薦為NSCLC的一線治療方法[5]?;顧z組織病理學標本最常用于檢測EGFR的突變狀態(tài),但是由于腫瘤的異質(zhì)性、取樣的偏差、耗時的程序、有創(chuàng)并且增加了癌癥轉(zhuǎn)移的風險[6],一定程度上限制了其在EGFR突變檢測中的應用。影像組學是從影像圖像中高通量地提取大量影像信息,將視覺影像信息轉(zhuǎn)化為深層次的定量影像特征來進行量化研究,不僅有效地解決了腫瘤異質(zhì)性難以定量評估的問題,而且無創(chuàng),可以重復進行[7]。影像組學在肺部病變的定性、肺癌的分級與分期、肺癌的療效評估和預后預測等方面已有較為廣泛的研究[8-9],本文旨在探究影像組學聯(lián)合臨床特征在預測肺腺癌EGFR突變狀態(tài)中的價值。
1.1 一般資料 選取2019-2020年蚌埠醫(yī)學院第一附屬醫(yī)院收治的125例經(jīng)病理證實為肺腺癌的病人,男51例,女74例,年齡29~82歲。納入標準:(1)術前2周內(nèi)接受完整的胸部CT檢查;(2) CT檢查前未接受任何治療;(3)病理證實為肺腺癌;(4)臨床資料完整。排除標準:(1)術前2周內(nèi)未接受完整的胸部CT檢查(6例);(2)未進行根治性手術治療(8例);(3)CT檢查前接受過系統(tǒng)性或局部性治療(3例);(4)術后病理證實為非肺腺癌(8例);(5)合并阻塞性肺不張或其他肺部病變(8例);(6)臨床資料不完整(3例)。
入組病人中,EGFR突變77例,野生型EGFR 48例。按照6:4隨機分成訓練組(共74例,其中EGFR突變49例,野生型EGFR 25例)和驗證組(共51例,其中EGFR突變28例,野生型EGFR 23例)。臨床資料包括年齡、性別、吸煙史。本研究經(jīng)醫(yī)院倫理委員會審核通過。
1.2 儀器與方法 所有病人均排除CT檢查禁忌證,檢查前訓練病人吸氣后屏氣。病人取仰臥位,掃描范圍為肺尖至肺底。采用GE Revolution 256排CT(GE Healthcare,USA),管電壓120 kV,管電流380 mA,螺距0.992∶1,視野444 mm×444 mm,掃描層厚和層間距均為5 mm,窗寬800 HU,窗位-700 HU,圖像重建層厚為0.625 mm。
1.3 CT征象分析 在不告知病理結果的前提下,由兩名放射科醫(yī)生對每位病人進行CT征象評估,意見不一致時,經(jīng)討論達成一致后記錄主觀評估結果。評估項目包括病灶形態(tài)(規(guī)則或不規(guī)則)、密度[實性或磨玻璃(ground glass opacity,GGO)]、邊界(清晰或模糊)、分葉征、毛刺征、暈征、鈣化、瘤內(nèi)壞死、空泡、空洞、空氣支氣管征、外周纖維化、胸膜牽拉、胸膜接觸、臨近胸膜增厚、胸腔積液、周圍肺氣腫、肺門/縱隔淋巴結腫大。
具體評價標準(1)病灶大小:目標病灶橫斷面的最大直徑。(2)形態(tài)規(guī)則:病灶形態(tài)呈圓形、橢圓形,包括2或3個波狀起伏。(3)形態(tài)不規(guī)則:病灶形態(tài)既不是圓形、橢圓形,也不是分葉。(4)分葉:定義為>3個波狀起伏。(5)毛刺:從腫塊上突出的尖銳線條。(6)暈征:為磨玻璃影圍繞結節(jié)或腫塊。(7)GGO:為CT圖像上肺密度輕度增加,支氣管血管束清晰可辨,形似磨玻璃。(8)空泡:肺部腫塊內(nèi)殘留的含氣肺組織或支氣管形成的直徑3 mm以內(nèi)的含氣低密度區(qū)。(9)空洞:病灶內(nèi)直徑3 mm以上的含氣低密度區(qū)。(10)空氣支氣管征:在實變區(qū)中可見到含氣的支氣管分支影。(11)胸膜牽拉:從斷層圖像顯示為近臟層胸膜面見小三角形影或小喇叭狀陰影,三角形的底部在胸壁,尖指向結節(jié),結節(jié)與三角形影之間可為線狀影相連。(12)周圍肺氣腫:指終末細支氣管遠端氣腔出現(xiàn)持久異常的擴張,并伴有肺泡和細支氣管的破壞、肺透亮度增高。(13)肺門/縱隔淋巴結腫大:淋巴結短徑>15 mm。
1.4 腫瘤分割、特征提取與降維 將CT平掃薄層圖像上傳至“醫(yī)準-達爾文”智能科研平臺(www.yizhun-ai.com),在病灶邊界手動逐層勾畫腫瘤的三維感興趣體積(volume of interest,VOI)(見圖1、2),提取影像組學特征。采用“最小最大值歸一化”進行數(shù)據(jù)預處理,將每一維度特征線性拉伸到指定的區(qū)間[1],以使算法收斂更快,得到更加合理的模型。采用LASSO-Logistic算法經(jīng)驗性地保留50個影像組學。經(jīng)過5折交叉驗證后確定LASSO最優(yōu)調(diào)諧參數(shù)alpha值,并繪制LASSO系數(shù)剖面圖。在最優(yōu)調(diào)諧參數(shù)alpha處繪制垂直線,得到6個衰減系數(shù)非零的影像組學特征。
1.5 模型建立與驗證 采用支持向量機(support vector machine,SVM)分類器,結合臨床因素、CT征象構建臨床模型,結合影像組學特征構建影像組學模型,結合臨床因素、CT征象及影像組學特征構建聯(lián)合模型。
1.6 統(tǒng)計學方法 采用t檢驗、χ2檢驗以及l(fā)ogistic回歸分析。
2.1 一般資料 無吸煙史、毛刺征、GGO以及胸膜牽拉與肺腺癌EGFR突變狀態(tài)顯著相關(P<0.05)(見表1)。
表1 肺腺癌病人的臨床因素與CT征象統(tǒng)計[n;構成比(%)]
續(xù)表1
2.2 影像特征的選擇 共提取936個影像組學特征,經(jīng)降維最終選取了6個與EGFR突變顯著相關的影像組學特征,將其按照權重系數(shù)由高到低排列(見圖3)。
2.3 模型的構成與預測效能 臨床模型由吸煙史、毛刺征、GGO及胸膜牽拉構成;影像組學模型由提取的6個影像組學特征構成;聯(lián)合模型由吸煙史、毛刺征、磨玻璃密度、胸膜牽拉以及6個影像組學特征構成。聯(lián)合模型在訓練組和驗證組中的AUC均高于影像組學模型和臨床模型(見表2),聯(lián)合模型比影像組學模型和臨床模型具有更高的預測效能(見圖4)。
表2 3種模型在訓練組和驗證組中的AUC
本研究旨在探究影像組學結合臨床對肺腺癌EGFR突變狀態(tài)的預測效能。本次研究共納入6個影像組學特征對肺腺癌EGFR的突變狀態(tài)進行預測,在訓練組和驗證組中的AUC分別達到了0.818和0.797,高于臨床因素與CT征象的預測效能。當影像組學結合臨床因素與CT征象后,其預測效能得到進一步提高,AUC分別達到了0.860與0.855,展示出了較佳的預測能力。ZHANG等[10]的研究也表明影像組學對EGFR的突變狀態(tài)具有較佳的預測效能,其在訓練組與驗證組中的AUC分別為0.759、0.770,優(yōu)于臨床變量;當影像組學特征結合臨床變量后,其AUC分別提高到0.861、0.872,本研究結果基本與之一致。影像組學是將橫斷面影像陣列(如 CT、MRI、PET-CT)轉(zhuǎn)化為可定量的影像特征,本質(zhì)上是將圖像數(shù)據(jù)化,進行精準定量分析,大量的影像數(shù)據(jù)可以實現(xiàn)常規(guī)影像學不能達到的醫(yī)療數(shù)據(jù)整合,相比于傳統(tǒng)的形態(tài)學診斷模式,更為詳細、客觀與準確,這可能是影像組學模型的預測效能高于臨床模型的原因。
峰度作為一階特征(First order),用于描述感興趣區(qū)域內(nèi)灰度值分布的陡峭程度。峰度的絕對值數(shù)值越大,表示其分布形態(tài)的陡緩程度與正態(tài)分布的差異度越大[11]。本次研究發(fā)現(xiàn),肺腺癌EGFR突變型與野生型的峰度有較為顯著的差異,這與DIGUMARTHY等[12]的研究基本一致。此外,一項研究報告[13]表明,峰度還可以作為腫瘤血管生成的替代標志物,有助于預測和評估EGFR突變型腺癌病人抗血管生成治療的反應。歸一化尺度區(qū)域不均勻性(size zone non-uniformity normalized,SZNN)是灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征,為高階紋理特征,是衡量整個圖像大小區(qū)域體積可變性的度量[14]。在一項對298例病人的研究[15]中,研究者從病灶平掃CT的VOI中提取影像組學特征,并進行邏輯回歸分析,發(fā)現(xiàn)SZNN是EGFR突變的危險因素,本研究結果與之一致。在我們的分析中,基于CT圖像的腫瘤最大直徑并不是EGFR突變的顯著預測因子,而基于影像組學的最大2D直徑(列)(Maximum 2D diameter Column)卻與EGFR突變狀態(tài)相關,我們認為,這種差異可以部分地由以下事實來解釋:CT上評估腫瘤直徑是在橫斷位最大層面上手工測量的,并且限于腫瘤的一個維度,而基于尺寸的影像組學特征則考慮了整個腫瘤。本次研究發(fā)現(xiàn)EGFR突變型與野生型肺腺癌病人在吸煙史、GGO、胸膜牽拉方面存在顯著差異。先前研究[16-17]表明無吸煙史、GGO以及胸膜牽拉是EGFR突變陽性的獨立預測因子, DANG等[18]的研究同樣驗證了該結果。WANG等[19]發(fā)現(xiàn)EGFR突變型肺腺癌病人的GGO體積百分比明顯高于野生型病人,這一結果可能與EGFR突變在貼壁為主型腺癌中更常見有關,其在CT上通常表現(xiàn)為GGO為主的結節(jié)[20]。此前也有研究[21]表明EGFR突變狀態(tài)和GGO無關,產(chǎn)生分歧的原因可能是樣本量選擇存在偏差所致。研究者為了避免病灶血管管腔內(nèi)高濃度造影劑對病灶產(chǎn)生硬化偽影干擾,遮蓋病灶紋理特征,故選取平掃CT圖像進行研究。
本研究存在幾點不足之處:(1)樣本量??;(2)病灶VOI是由放射科醫(yī)生手動分割完成,一定程度上受到觀察者主觀意識的影響,特別是在腫瘤具有GGO成分和短毛刺的情況下,它們的邊緣通常與鄰近正常的肺實質(zhì)分界不清,難免產(chǎn)生分割誤差;(3)本研究為回顧性研究,存在一定偏倚。
總之,我們的研究發(fā)現(xiàn)肺腺癌EGFR突變狀態(tài)與某些影像組學特征之間存在一定的相關性,影像組學特征有望成為鑒別EGFR突變的潛在替代生物標記物,這些特征結合臨床因素與CT征象后可以前瞻性地預測肺腺癌的EGFR突變狀態(tài),為EGFR突變病人的臨床精準治療提供支持。