孫伯堯,姜 洋*,鄭雪微,丁 軍 ,劉 碩,管玉瑤,李 佟,于保婷,治 南
(吉林大學中日聯(lián)誼醫(yī)院 1.胃腸外科; 2.放射線科,吉林 長春130033)
近年來直腸癌發(fā)病率及死亡率呈逐年上升的趨勢,其中T3期約占60%-80%。目前直腸癌的治療主要包括手術(shù)治療和新輔助治療,對于T分期達T3或N+的患者,建議先進行新輔助放化療。因此,患者術(shù)前準確分期,對于制定治療方案及預后至關(guān)重要。高分辨率MRI無法準確鑒別患者術(shù)前腫瘤是否侵犯周圍脂肪間隙,造成術(shù)前T2與T3期的過高或過低分期[1]。本研究通過對T2、T3期直腸癌ADC序列影像組學特征進行研究,包括提取病灶區(qū)域影像特征、特征篩選,進而通過分析比較建立高效穩(wěn)定的診斷模型,對指導臨床制定個體化的治療方案具有重要指導意義。
收集2019年1月-2020年1月于我院就診的59例直腸癌患者的臨床及影像資料,男39例,女20例,平均年齡(51.35±7.05)歲,其中T2期患者16例,T3期患者43例。納入標準:①術(shù)后病理證實為T2、T3 期直腸腺癌;②具有完整的影像學資料;③術(shù)前未進行新輔助放化療;④術(shù)后取得完整的病理結(jié)果。排除標準:①幽閉恐懼癥患者;②特殊的病理類型,如黏液腺癌。③圖像質(zhì)量差,運動偽影明顯,影響圖像分割及影像組學特征提取。
采用德國西門子公司1.5TMR掃描儀,8通道體部相控陣線圈,檢查前進行腸道準備,患者取仰臥位,掃描序列和參數(shù):DWI軸位掃描,TR/TE 采用 4 800 ms/66 ms,矩陣112×112,F(xiàn)OV 360×360 cm,層間距 0 mm,層數(shù) 30 層,層厚5 mm,b值取800 s/mm2。
首先將59例直腸癌患者影像資料以DICOM形式導出,并將ADC圖上傳至多模態(tài)科研平臺,由2名具有多年診斷經(jīng)驗的醫(yī)生在ADC圖上逐層手動勾畫腫瘤的ROI,盡量避開正常腸壁及周圍組織。利用PyRadiomics工具包對已標注的所有ROI提取影像特征,對原始MR圖像進行小波變換和拉普拉斯高斯變換預處理后,針對影像數(shù)據(jù)提取高通量特征,主要包括以下7種:一階特征(first-order feature)、形態(tài)特征(Shape Features)、灰度共生矩陣特征(GLCM)、灰度區(qū)域矩陣特征(GLSZM)、灰度游程矩陣(GLRLM)、灰度相依矩陣(GLDM)、鄰域灰度差分矩陣特征(NGTDM)。運用L1 Based(L1正則)進行特征篩選,最終篩選出5個特征,最后利用篩選的特征構(gòu)建診斷模型。本研究中選用邏輯回歸(LR)、支持向量機(SVM)、決策樹(decision tree)、隨機森林(RF)、極限梯度增強(XGBoost)等多種算法進行建模,最后從中選取出診斷效能較高的兩個預測模型。
采用 SPSS 22.0和MedCalc 9.0 軟件進行統(tǒng)計分析,P<0.05 為差異有統(tǒng)計學意義。繪制預測模型的ROC曲線,計算AUC、敏感度、特異度、準確率,以及F1值,以評估影像組學模型的可預測性。采用組內(nèi)相關(guān)系數(shù)(ICC)評價2名醫(yī)師測量數(shù)據(jù)的一致性。
本研究中共納入經(jīng)病理證實的直腸癌59例,男39例,女20例,其中T2期患者16例,T3期患者43例,臨床癥主要包括便血、大便性狀改變以及里急后重等。
本研究共提取1132個影像組學特征,最終納入5個特征用于構(gòu)建影像組學模型,5個特征(表1)分別為wavelet-HLL_firstorder_Skewness、original_shape_Maximum2DDiameterColumn、log-sigma-3-0-mm-3D_glszm_LargeAreaLowGrayLevelEmphasis、wavelet-HLH_firstorder_Mean。應(yīng)用5折交叉驗證的方法建立組學模型,進而通過ROC曲線下面積、特異性、敏感性及準確性等進行模型評價,兩名醫(yī)生測量結(jié)果具有很好的一致性,ICC值(ICC值為0.85-0.90)。
表1 篩選出的5個組學特征
采用多種分類器算法構(gòu)建模型,其中以邏輯回歸(圖1A)及支持向量機(圖1B)算法構(gòu)建的模型診斷效能較高,兩種模型ROC曲線結(jié)果顯示基于影像組學特征的預測模型的AUC分別為0.836、0.828,曲線下面積差異無統(tǒng)計學意義,敏感性為81.4%、86.0%,特異性為81.3%、62.5%,準確度為0.814、0.797,F(xiàn)1值為0.864、0.861(表2)。兩組預測模型的模型評分圖中(圖略),分值越大越傾向于T3期直腸癌。
圖1 基于影像組學特征的預測模型診斷T2、T3期直腸癌的ROC曲線A 邏輯回歸建模方法;B 支持向量機建模方法
表2 兩種建模方法鑒別T2、T3期直腸癌的診斷效能分析
隨著直腸癌發(fā)病率的逐年升高,MR檢查對于直腸癌的定性定量分析也成為了目前研究熱點之一。高分辨率T2WI成為術(shù)前分期較重要的成像序列,通常T3期術(shù)后局部復發(fā)及轉(zhuǎn)移的風險較高,需要先行新輔助放化療,較多文獻對T2、T3期的鑒別診斷展開研究,以期幫助臨床醫(yī)師制定合理的個體化診療決策。影像組學(radiomics)應(yīng)用大量的自動化數(shù)據(jù)特征化算法,將影像興趣區(qū)(ROI)的影像數(shù)據(jù)轉(zhuǎn)化為具有高分辨率的、可發(fā)掘的特征空間數(shù)據(jù),具有數(shù)據(jù)維度高、定量分析等優(yōu)點,可將傳統(tǒng)影像學與分子生物學、分子病理學、信息科學相整合,從而實現(xiàn)對疾病的精準預測、診斷及預后評估等[2,3]。
本研究是基于ADC序列提取的影像組學特征,用于術(shù)前診斷T2、T3期直腸癌。對59例直腸癌病灶的ADC圖進行特征提取,初始共包括1132個影像組學特征,利用L1 Based(L1正則)進行特征篩選,最終篩選出特征主要分為:①一階特征:通過基本的一階統(tǒng)計量來描述靶區(qū)內(nèi)部的像素強度及其分布,如均值、方差等。②形態(tài)特征:描述靶區(qū)的形態(tài)和大小,如體積、直徑、圓度等。③灰度區(qū)域矩陣特征:通過在圖像上二維區(qū)域內(nèi)記錄相同元素相鄰的情況出現(xiàn)的次數(shù)即灰度區(qū)域矩陣,來描述紋理。④灰度共生矩陣特征:通過統(tǒng)計圖像上保持某距離的兩像素分別具有某灰度的狀況,即灰度的空間相關(guān)特性,來描述紋理。通過比較多種分類器算法鑒別T2、T3期直腸癌的曲線下面積AUC、敏感性及特異性等,最后得出應(yīng)用LR、SVM兩種分類器算法構(gòu)建的預測模型對T2、T3期直腸癌鑒別診斷效能較高,機器學習結(jié)果顯示LR、SVM分類器的AUC分別為0.836、0.828,敏感性為81.4%、86.0%,特異性為81.3%、62.5%。分類問題中LR及SVM是比較經(jīng)典的構(gòu)建模型的算法,LR是一種廣義的線性回歸分析模型,使用Sigmoid函數(shù),將線性模型的結(jié)果壓縮到0-1,使其擁有概率意義;SVM是一個有監(jiān)督的學習模型,通常用來進行模型的識別、分類以及回歸分析。與線性模型相比,幾乎不會增加計算的復雜性,而且在某種程度上避免了“維數(shù)災難”[4]。有文獻報道兩種模型可應(yīng)用于腫瘤的不同組織分型和鑒別診斷良惡性腫瘤等[5-8],定量的影像組學分析已成為腫瘤特征的鑒別和預后評估的重要手段。
本研究只選擇了ADC序列進行影像組學研究,樣本量不夠大,尚未納入T2WI序列進行分析比較??傊?,基于ADC序列構(gòu)建的影像組學模型的建立,對鑒別T2、T3期直腸癌具有重要的臨床應(yīng)用價值。