国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

CT影像組學(xué)模型及深度學(xué)習(xí)技術(shù)預(yù)測肺腺癌EGFR突變

2022-08-19 09:05黃櫟有徐璐溫林春王延花李智勇
放射學(xué)實踐 2022年8期
關(guān)鍵詞:組學(xué)腺癌紋理

黃櫟有,徐璐,溫林春,王延花,李智勇

肺腺癌是肺癌中發(fā)病率最高的組織學(xué)類型[1]。隨著分子靶向藥物研究的不斷發(fā)展,近年來酪氨酸激酶抑制劑(tyrosine kinase inhibitors,TKIs)如吉非替尼等藥物已廣泛用于肺腺癌的臨床治療,患者獲得了比化療更長的無進(jìn)展生存期[2]。表皮生長因子受體(epidermal growth factor receptor,EGFR)基因表型決定了患者是否能夠接受TKIs治療[3]。如何快速有效的檢測EGFR基因突變就變得格外重要。目前臨床上主要通過內(nèi)窺鏡及穿刺活檢來檢測患者EGFR基因突變。但活檢僅能采集局部少量腫瘤組織,無法反映腫瘤整體的異質(zhì)性,容易出現(xiàn)因采集部位不佳或采集樣本過少而無法正確檢測出突變結(jié)果的情況。此外,活檢術(shù)對患者身體條件及腫瘤大小、位置等均有較高要求,而且高昂的檢查費(fèi)用也限制了其在臨床上的普及。CT掃描作為臨床上常用的影像學(xué)檢查技術(shù),為分析腫瘤異質(zhì)性提供了一種非入侵式的方法。已有研究表明,肺癌CT圖像中的紋理特征與基因表達(dá)具有相關(guān)性,能夠預(yù)測EGFR基因突變[4-5]。而深度學(xué)習(xí)技術(shù)通過強(qiáng)大的端對端學(xué)習(xí)能力,已經(jīng)在多種疾病的診斷中展現(xiàn)出遠(yuǎn)超傳統(tǒng)分類模型的診斷能力[6-8]。因此,本研究中對比分析了傳統(tǒng)影像組學(xué)模型和深度學(xué)習(xí)模型對肺腺癌患者EGFR突變的預(yù)測效能,旨在探尋基于CT掃描圖像預(yù)測肺腺癌EGFR基因突變的最佳方法。

材料與方法

1.研究對象

回顧性搜集2018年1月-2021年5月在本院確診為肺腺癌的228例患者的CT影像資料。其中,EGFR突變型 116例,野生型112例。納入標(biāo)準(zhǔn):①經(jīng)病理證實為原發(fā)肺腺癌;②具有EGFR基因檢測結(jié)果;③CT檢查前未接受任何治療。排除標(biāo)準(zhǔn):①腫瘤直徑小于3.0 mm;②CT圖像質(zhì)量不佳;③合并其它惡性腫瘤。

2.檢查方法

使用Siemens Somatom Definition AS(101例)或Philips Brilliance 64 CT機(jī)(127例)行胸部CT掃描。掃描參數(shù):120 kV,210 mA,螺距0.9,掃描層厚1~5 mm。分別采用B40f和iDose標(biāo)準(zhǔn)重建算法進(jìn)行圖像重建,重建層厚1~2 mm。

3.影像組學(xué)分析方法

圖像分割及特征提?。菏褂肕RIcroGL軟件對CT影像進(jìn)行重采樣,重采樣后圖像的像素大小為1 mm×1 mm×1 mm。由2位具有7年以上CT診斷經(jīng)驗的放射科醫(yī)師分別在肺窗(窗寬1500 HU,窗位-600 HU)圖像上采用單盲法各自獨(dú)立在所有腫瘤層面進(jìn)行ROI的勾畫,并將獲得的病灶容積ROI(VOI)保存為掩模數(shù)據(jù)(圖1)。分別采用一階統(tǒng)計、灰度共生矩陣、灰度游程矩陣和小波變換等方法對VOI進(jìn)行特征提取,共得到395個影像組學(xué)特征。采用組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)對兩位醫(yī)師提取的特征進(jìn)行一致性檢驗,以ICC值大于0.7表示一致性較好。

圖1 男,53歲,左肺腺癌。a)橫軸面、矢狀面和冠狀面CT圖像顯示左肺內(nèi)病灶3個方位的特征;b)沿病灶邊緣逐層手動勾畫ROI后,橫軸面、矢狀面和冠狀面CT圖像顯示ROI(紅色區(qū)域)的三方向觀;c)ROI掩模圖像的三方向觀,白色ROI像素值為1,其余像素值為0。

影像組學(xué)建模:對紋理特征進(jìn)行歸一化和標(biāo)準(zhǔn)化后,刪除與其它紋理特征相關(guān)系數(shù)大于0.9的特征。按照7:3的比例將所有病灶隨機(jī)劃分為訓(xùn)練集和驗證集。采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)和5折交叉驗證對訓(xùn)練集數(shù)據(jù)進(jìn)行特征篩選,并通過對所篩選特征及其權(quán)重系數(shù)的線性組合來構(gòu)建每例患者的影像組學(xué)評分(Radscore)。

使用Wilcoxon檢驗分別對訓(xùn)練集和驗證集中EGFR突變型組和野生型組的Radscore進(jìn)行比較,以P<0.05為差異具有統(tǒng)計學(xué)意義。繪制驗證集中Radscore的受試者工作特征曲線(receiver operating characteristic curve,ROC),計算曲線下面積(AUC)。

機(jī)器學(xué)習(xí)模型的建立和驗證:分別建立隨機(jī)森林(random forest,RF)和支持向量機(jī)(support vector machine,SVM)機(jī)器學(xué)習(xí)模型。在訓(xùn)練集中采用5折交叉驗證法分別對2種機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,并計算它們在驗證集中的AUC。

4.深度學(xué)習(xí)分析方法

數(shù)據(jù)預(yù)處理:通過對CT圖像像素矩陣與對應(yīng)ROI掩模數(shù)據(jù)進(jìn)行矩陣乘法,使ROI體素外像素值為0,保證深度學(xué)習(xí)分析區(qū)域與影像組學(xué)ROI一致。對ROI進(jìn)行裁剪,去除周圍全零區(qū)域得到最終圖像數(shù)據(jù)。

數(shù)據(jù)增廣:深度學(xué)習(xí)訓(xùn)練集和驗證集的劃分與影像組學(xué)訓(xùn)練集和驗證集劃分完全一致。由于樣本量較小,我們將訓(xùn)練集中每個病灶的所有層面圖像均作為輸入樣本,共計將2873幀圖像輸入到2D殘差網(wǎng)絡(luò)(ResNet)深度學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,并通過對圖片進(jìn)行隨機(jī)20度旋轉(zhuǎn)和左右、上下鏡像進(jìn)一步擴(kuò)充訓(xùn)練集數(shù)據(jù)至理論上限459680幀。在驗證集中選取每個病灶直徑最大層面的圖像作為驗證集數(shù)據(jù),共68幀圖像。

ResNet和遷移學(xué)習(xí):將每幀圖像的大小重置為224×224×3像素并輸入ResNet網(wǎng)絡(luò)。遷移學(xué)習(xí)技術(shù)能將某個網(wǎng)絡(luò)中學(xué)習(xí)到的知識遷移到另一個具有共通性的網(wǎng)絡(luò)中。本研究利用遷移學(xué)習(xí)技術(shù)將Image-Net上訓(xùn)練好的預(yù)訓(xùn)練模型參數(shù)作為模型初始參數(shù)遷移到ResNet網(wǎng)絡(luò)中。ImageNet是擁有128萬幀自然圖像的大型數(shù)據(jù)庫,官方(https://download.pytorch.org/models)提供了基于該數(shù)據(jù)庫的ResNet預(yù)訓(xùn)練模型。通過遷移學(xué)習(xí)ImageNet上的模型參數(shù)能夠間接擴(kuò)大訓(xùn)練數(shù)據(jù),從而提高神經(jīng)網(wǎng)絡(luò)的性能。

深度學(xué)習(xí)模型的建立和驗證:選擇交叉熵作為模型的損失函數(shù),對訓(xùn)練集數(shù)據(jù)進(jìn)行循環(huán)訓(xùn)練,以交叉熵?fù)p失最小的循環(huán)作為最佳深度學(xué)習(xí)模型。計算此深度學(xué)習(xí)模型在驗證集中的AUC,并比較其與其它3種影像學(xué)組模型的AUC的差異。

5.統(tǒng)計學(xué)處理

采用pytorch1.04深度學(xué)習(xí)庫搭建深度學(xué)習(xí)網(wǎng)絡(luò),并利用visdom模塊繪制損失(loss)曲線。采用R語言(Version 3.5.1)對患者資料進(jìn)行統(tǒng)計學(xué)分析。對患者年齡進(jìn)行正態(tài)性檢驗,符合正態(tài)分布,故其數(shù)據(jù)資料采用均值±標(biāo)準(zhǔn)差來表示,采用兩獨(dú)立樣本t檢驗進(jìn)行組間比較。采用皮爾遜χ2檢驗比較2組間性別構(gòu)成的差異。以P<0.05為差異有統(tǒng)計學(xué)意義。采用corrplot軟件包進(jìn)行相關(guān)性特征刪除,采用glmnet軟件包進(jìn)行LASSO數(shù)據(jù)降維,利用pROC軟件包繪制模型或參數(shù)的AUC,并采用Delong檢驗比較各模型間AUC的差異。

結(jié) 果

1.人口學(xué)資料的比較

EGFR突變組患者年齡為39~80歲,平均(60.55±8.65),野生組患者年齡為42~83歲,平均(62.59±9.13)歲,組間差異無統(tǒng)計學(xué)意義(t=1.729,P=0.085)。突變組中男47例、女69例,野生組中男67例、女45例;兩組間性別構(gòu)成的差異具有統(tǒng)計學(xué)意義(χ2=6.377,P=0.012)。

2.影像組學(xué)分析

一致性分析結(jié)果顯示,在兩位醫(yī)師各自提取的肺癌病灶的395個影像組學(xué)特征中有306個特征的觀察者間一致性較好(ICC>0.7),其中參與建模特征的ICC值見表1。

表1 參與建模的紋理參數(shù)的一致性檢驗結(jié)果

自306個一致性良好的組學(xué)特征中刪除相關(guān)系數(shù)大于0.9的特征,剩余122個特征。經(jīng)過5折交叉驗證得到LASSO回歸中參數(shù)λ值與模型均方誤差的關(guān)系圖(圖2a)。選擇λ值為LASSO回歸均方誤差最小值加一倍標(biāo)準(zhǔn)差時(0.071)作為最佳LASSO回歸參數(shù),最終從剩余的122個紋理特征中篩選出9個紋理特征(圖2b)。得到的Radscore計算方程:Radscore=0.02375800-LLH_DifferenceVariance×0.03231060+LLH_InverseVariance×0.11277837-LHH_Autocorrelation×0.25185757-HLL_Autocorrelation×0.04808175+HHH_Correlation×0.06753695-sigma_2mm_ClusterProminence×0.10374467-sigma_3mm_ClusterTendency×0.09305346+sigma_5mm_ClusterShade×0.09416770-square_ClusterTendency×0.19429391。在訓(xùn)練集和測試集中樣本的Radscore數(shù)據(jù)分布差異如圖3所示,訓(xùn)練集和驗證集中EGFR突變組的Radscore均顯著高于未突變組(訓(xùn)練集:Z=-6.771,P<0.001;驗證集:Z=-3.793,P<0.001)。

圖2 LASSO模型參數(shù)圖。 a)5折交叉驗證得到參數(shù)λ值,第1條虛線為LASSO均方誤差最小值對應(yīng)的λ值,第二條虛線為最小誤差1倍標(biāo)準(zhǔn)差對應(yīng)的λ值; b) 紋理特征的LASSO系數(shù)曲線,在均方誤差最小值1倍標(biāo)準(zhǔn)差處繪制虛線得到9個紋理特征。 圖3 Rad-score預(yù)測EGFR突變箱式散點圖。Label 0代表野生型,label 1代表突變型。 圖4 ResNet 損失函數(shù)隨epoch的變化曲線,顯示損失值在前10個epoch迅速下降,在50個epoch后趨于穩(wěn)定。 圖5 四種模型在驗證集中的ROC曲線圖,以Resnet的AUC最大。

基于篩選出的9個紋理特征,在訓(xùn)練集中訓(xùn)練得到RF和SVM 2種機(jī)器學(xué)習(xí)模型。RF模型中參數(shù)設(shè)置:決策樹數(shù)量500,二叉數(shù)2;SVM模型參數(shù):懲罰因子C值=1,sigma=0.143。

Radscore、RF和SVM三種模型在訓(xùn)練集上和驗證集中對EGFR突變的診斷效能指標(biāo)值見表2。在測試集中3種模型的AUC值均超過0.7,表現(xiàn)出良好的診斷效能。在驗證集中以SVM模型的AUC最大,但與RF和Radscore模型的差異無統(tǒng)計學(xué)意義(Z=-0.975,P=0.330;Z=1.700,P=0.089)。

表2 四種模型ROC分析結(jié)果

3.深度學(xué)習(xí)模型的效能

訓(xùn)練集中輸入數(shù)據(jù)的batch size=32,學(xué)習(xí)率為0.0001,循環(huán)次數(shù)為100 epoch。結(jié)果顯示在前10個epoch交叉熵?fù)p失迅速下降,在50個epoch后趨于穩(wěn)定(圖4),第73個epoch時交叉熵?fù)p失最低(0.12),得到最佳模型。

在驗證集中,深度學(xué)習(xí)方法獲得的RseNet模型的AUC、敏感度和特異度均高于另外3種影像組學(xué)模型(表2、圖5),ResNet與Radscore、RF模型間AUC的差異具有統(tǒng)計學(xué)意義(Z=-2.178,P=0.031;Z=-2.051,P=0.043),與SVM模型間AUC的差異無統(tǒng)計學(xué)意義(Z=-1.627,P=0.106)。

討 論

本研究建立并比較了多種基于CT圖像影像組學(xué)特征建立的預(yù)測模型,評估其預(yù)測肺腺癌患者EGFR突變的能力。建立的Radscore模型(一種線性模型)證實了通過分析CT圖像能夠預(yù)測肺腺癌患者EGFR基因突變。通過對線性模型、機(jī)器學(xué)習(xí)模型以及深度學(xué)習(xí)模型進(jìn)行比較,來篩選預(yù)測EGFR突變的最佳模型算法。本研究結(jié)果顯示,深度學(xué)習(xí)模型的預(yù)測表現(xiàn)明顯優(yōu)于其它預(yù)測模型,表明基于CT影像組學(xué)分析能夠預(yù)測EGFR突變,深度學(xué)習(xí)技術(shù)可以有效提高模型的預(yù)測準(zhǔn)確性。

相對于傳統(tǒng)人工閱片,影像組學(xué)通過對圖像進(jìn)行定量分析,能夠利用不同分析方法從圖像中提取多維度影像組學(xué)特征。其中一些特征可以反映肉眼難以觀察到的腫瘤內(nèi)部異質(zhì)性信息[9]。影像組學(xué)已被應(yīng)用于疾病的診斷以及療效和預(yù)后的預(yù)測等[10-12]。近年來,一些研究嘗試建立影像組學(xué)與相應(yīng)基因的聯(lián)系。Tu等[13]基于CT圖像提取的93個紋理特征構(gòu)建肺癌EGFR突變預(yù)測模型,在訓(xùn)練集和驗證集中的AUC分別為0.762和0.775;吳琦等[14]從396個紋理特征中篩選出11個最佳特征構(gòu)建logistic回歸模型來預(yù)測肺腺癌EGFR基因突變狀態(tài),訓(xùn)練集ROC曲線的AUC為0.83 ;羅燕等[15]聯(lián)合影像組學(xué)特征和吸煙狀態(tài)建立logistic回歸模型,預(yù)測肺腺癌EGFR突變的AUC為0.673。本研究中Radscore模型預(yù)測肺腺癌EGFR突變的AUC為0.761,與上述研究結(jié)果相符。

既往數(shù)研究大多未考慮模型算法的影響,僅通過簡單線性模型對EGFR突變進(jìn)行預(yù)測,診斷結(jié)果并不盡如人意。本研究中利用機(jī)器學(xué)習(xí)算法建立多種模型并比較其診斷效能,旨在提高影像組學(xué)方法預(yù)測EGFR基因突變的準(zhǔn)確性,尋找最佳模型算法。本研究中基于提取的CT影像組學(xué)特征建立了Radscore、RF和SVM三種模型,在驗證集中的AUC分別為0.761、0.775和0.813,以SVM模型的診斷效能最高。雖然SVM模型與Radscore和RF模型間的差異無統(tǒng)計學(xué)意義,但我們認(rèn)為該問題通過進(jìn)一步擴(kuò)大樣本將得到解決。SVM算法通過搜索對空間最佳劃分的超平面進(jìn)行特征分類,對數(shù)據(jù)維度和樣本數(shù)量的依賴性較小。已有研究發(fā)現(xiàn)相較于傳統(tǒng)回歸模型,SVM算法能夠有效提升模型的預(yù)測性能,如彭濤等[16]研究結(jié)果表明基于MRI影像組學(xué)特征建立的SVM模型對前列腺癌的診斷效能優(yōu)于線性回歸模型;李琳等[17]研究結(jié)果表明相較于logistic回歸模型,SVM模型可以更好地預(yù)測肝癌患者的預(yù)后。本研究結(jié)果與上述研究結(jié)果類似。

深度學(xué)習(xí)作為人工智能領(lǐng)域的一項重要技術(shù),可以通過神經(jīng)網(wǎng)絡(luò)自動對輸入圖像進(jìn)卷積,并利用梯度下降算法完成模型學(xué)習(xí),最終實現(xiàn)高精度預(yù)測。數(shù)據(jù)處理過程中僅需使用者定義腫瘤ROI,而無需進(jìn)行特征提取、特征選擇和模型構(gòu)建等傳統(tǒng)影像組學(xué)的復(fù)雜程序。已有將深度學(xué)習(xí)技術(shù)應(yīng)用于醫(yī)學(xué)圖像的診斷中,并得到了媲美診斷醫(yī)師級別的準(zhǔn)確性[18]。本研究中,利用深度學(xué)習(xí)方法構(gòu)建的ResNet網(wǎng)絡(luò)在驗證集中的AUC、敏感度、和特異度分別為0.916、0.879和0.914,均高于另外3種通過傳統(tǒng)方法建立的影像組學(xué)模型。本研究結(jié)果提示,在預(yù)測肺腺癌EGFR突變方面,深度學(xué)習(xí)技術(shù)較傳統(tǒng)方法構(gòu)建的預(yù)測模型更具優(yōu)勢。

本研究的局限性:①為單中心研究且樣本量相對較小,研究結(jié)果可能存在偏倚;②人工勾畫ROI,人為因素可能對特征提取造成誤差;③采用的模型算法有限,需進(jìn)一步擴(kuò)大算法種類。

綜上所述,基于CT圖像的影像組學(xué)模型能夠較好的預(yù)測肺腺癌EGFR突變,其中以深度學(xué)習(xí)模型的診斷效能更優(yōu),為EGFR檢測提供了一種有效的無創(chuàng)性檢測技術(shù)。

猜你喜歡
組學(xué)腺癌紋理
晚期肺腺癌患者奧希替尼后線治療耐藥后基因突變模式研究
管狀腺癌伴有黏液腺癌分化結(jié)直腸癌臨床病理與免疫組織化學(xué)特征
培美曲塞聯(lián)合順鉑一線化療在老年晚期肺腺癌治療中的效果探究
基于影像組學(xué)的直腸癌術(shù)前T分期預(yù)測
我國科學(xué)家揭示肺腺癌分子全景
肺紋理增多是病嗎?
填充型納流液相色譜長柱的蛋白質(zhì)組學(xué)分析性能考察
童夢
親水作用色譜/質(zhì)譜聯(lián)用方法用于膀胱癌患者血清代謝組學(xué)研究
學(xué)生學(xué)習(xí)方式創(chuàng)新談
青龙| 南汇区| 贡觉县| 唐山市| 丹巴县| 南靖县| 晴隆县| 南开区| 井陉县| 嫩江县| 杨浦区| 安国市| 湟中县| 子长县| 安塞县| 阳春市| 中山市| 柳江县| 德惠市| 河北区| 兰考县| 甘孜| 濉溪县| 尼玛县| 东辽县| 南溪县| 巍山| 舒城县| 荆州市| 镇安县| 阳泉市| 连城县| 花垣县| 加查县| 靖西县| 祁连县| 自治县| 凤冈县| 庆阳市| 万安县| 巨鹿县|