翟天童,尹平,孫超,洪楠
北京大學人民醫(yī)院放射科,北京 100044;*通信作者 洪楠 hongnan@pkuph.edu.cn
骨巨細胞瘤約占原發(fā)骨腫瘤的15%[1],可發(fā)生惡變。2020年世界衛(wèi)生組織骨與軟組織腫瘤分類中,將骨巨細胞瘤歸類為交界性腫瘤[2]。骨巨細胞瘤的治療方式以手術為主,包括病灶內(nèi)刮除、廣泛切除以及聯(lián)合放療等。術前預測骨巨細胞瘤的復發(fā)幾率有助于對不同復發(fā)風險患者給出更合理的治療建議[3]。
影像組學是將保存有腫瘤病理生理及基因表達信息的數(shù)字醫(yī)學圖像轉換為高維數(shù)據(jù),從醫(yī)學圖像中提取和篩選大量的定量數(shù)據(jù),用以構建預測性模型,協(xié)助診斷、療效評估,腫瘤分級、預后、預測治療反應及術后復發(fā)等[4]。本研究擬建立一個基于術前CT圖像影像特征的組學模型,預測骨巨細胞瘤3年內(nèi)的復發(fā)風險。
1.1 研究對象 回顧性收集2007年2月—2018年5月北京大學人民醫(yī)院經(jīng)病理證實的95例骨巨細胞瘤患者,通過查詢患者就診記錄及電話隨訪獲取非本地復查患者的影像學檢查結果,證實患者自發(fā)病以來3年有/無復發(fā)。按3∶1將患者隨機分為訓練組71例和測試組24例。納入標準:①采集樣本均為我院手術病理證實的骨巨細胞瘤患者;②每例患者術前在我院行CT檢查,并選用最初的CT圖像序列進行圖像分割及數(shù)據(jù)分析;③隨訪3年及以上。排除標準:①患者3年內(nèi)因其他原因死亡或失訪;②術前CT檢查存在手術治療、聯(lián)合治療后(如地諾單抗)等干擾因素。本研究經(jīng)本院醫(yī)學科學研究倫理委員會批準(審批號:2020PHB293-01),豁免患者知情同意。
1.2 儀器與方法 所有患者術前均行CT檢查,使用儀器:Philips Brilliance iCT 256層螺旋CT,管電壓100/120 kVp,有效管電流由程序設置根據(jù)患者體型自動選擇,范圍約100~500 mA,層厚1 mm;GE Lightspeed VCT 64層螺旋CT,管電壓100/120 kVp,有效管電流由程序設置根據(jù)患者體型自動選擇,范圍約100~500 mA,層厚1 mm;均采用骨及軟組織算法重建。
1.3 感興趣區(qū)(ROI)分割 本研究納入樣本采用2種不同的CT設備,首先對圖像進行重新采樣及灰度標準化的預處理工作,然后由2名具有10年閱片經(jīng)驗的醫(yī)師使用ITK-snap 3.8(www.itksnap.org)進行逐層手動分割。首先隨機抽取20例患者,分別由2名醫(yī)師同時進行ROI分割,根據(jù)這20例CT提取的特征計算觀察者組內(nèi)相關系數(shù)(ICC),ICC>0.8為一致性良好。通過一致性檢驗后,由醫(yī)師1對剩余75例CT進行勾畫。以上圖像分割過程均由1名具有20年以上診斷經(jīng)驗的放射科醫(yī)師指導進行。
1.4 影像組學特征提取、篩選與影像組學模型建立及評估 設備1采集圖像39例,設備2采集圖像56例。劉濤等[5]研究表明體素大小對CT影像組學特征有很大影響,因此圖像預處理工作是保證特征穩(wěn)定性的良好方法。采用MITKwokbench平臺(GE)進行圖像預處理工作并提取影像組學特征。使用Launch IPMs軟件(GE)對全部提取的組學特征進行篩選及模型建立。為避免影像組學標簽過擬合,采用下列算法進行特征降維:首先篩選出ICC>0.8的可復性高的組學特征,納入Spearman相關分析算法進行初次降維;其次選擇最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)方法及梯度提升迭代決策樹(gradient boosting decision tree,GBDT)進行再次降維。將最終篩選出的影像組學特征,計算影像組學特征系數(shù)。使用邏輯回歸(logistic regression,LR)及隨機森林(random forests,RF)建立預測模型,得出受試者工作特征(ROC)曲線下面積(AUC)和準確度評價模型的效能;運用測試組患者的數(shù)據(jù)對預測模型進行驗證。
1.5 統(tǒng)計學方法 采用SPSS 17.0軟件,正態(tài)分布的計量資料以±s表示,組間比較采用獨立樣本t檢驗;非正態(tài)分布的計量資料用M(Q1,Q3)表示。計數(shù)資料以例(%)表示,采用χ2檢驗。用Spearman相關分析計算特征與特征之間的相關系數(shù)。采用ICC評價2位醫(yī)師手動勾畫ROI的一致性;繪制ROC曲線對模型的效能進行評估,并計算AUC、準確度、敏感度和特異度。P<0.05為差異有統(tǒng)計學意義。
2.1 患者病例資料 95例骨巨細胞瘤患者中,男46例,女49例;年齡15~75歲,中位年齡32(25,42)歲。發(fā)病部位:脊柱7例,骨盆含骶骨36例,四肢長骨48例,肋骨1例,鼻竇1例,距骨1例,骰骨1例。復發(fā)27例,無復發(fā)68例。95例中,采取病變刮除11例,廣泛/根治切除84例。復發(fā)與無復發(fā)患者性別、發(fā)病部位差異有統(tǒng)計學意義(χ2=3.931、10.780,P<0.05)。
2.2 影像組學特征提取及篩選 2位醫(yī)師手動勾畫的ROI的ICC為0.8~0.9,使用醫(yī)學影像交互包,導入95例CT的原始圖像及對應的ROI文件進行特征提取,共提取出1 316個影像組學特征。首先用Spearman相關性分析方法計算特征與特征之間的相關系數(shù),篩選條件為0.7,經(jīng)第1次篩選得到160個影像組學特征。采用LASSO算法進行2次篩選,保留34個重要特征;最終通過GBDT算法對所獲特征進行最終篩選,共獲得12個影像組學特征,包括2大類,3個一階特征,9個灰度相關特征(表1、圖1)。
圖1 影像組學特征篩選流程。訓練組(A)及測試組(B)通過相關性分析算法進行特征降維的熱圖,圖中顯示所篩特征的相關性強弱;經(jīng)LASSO模型算法進行再次降維的路徑圖(C)與均方誤差(D),在最佳alpha值0.031時篩取34個特征;訓練組(E)及測試組(F)經(jīng)GBDT算法進行特征降維的熱圖
表1 篩選后用于建模的組學特征
2.3 模型結果對比 本研究結果顯示,訓練組中,LR的AUC為0.962,準確度為0.892;測試組中,LR的AUC為0.924,準確度為0.824,見表2。
表2 影像組學模型結果
在傳統(tǒng)影像學與影像組學研究中,骨巨細胞瘤的診斷和鑒別診斷已有成熟的體系,但關于預測術后復發(fā)的研究較少。本研究基于CT影像學標簽建立了獨立的預測模型,如果可以預測腫瘤的復發(fā)概率,將有助于選擇最優(yōu)治療及隨訪方案。
3.1 影像組學概述 影像組學可以通過不同信號強度的成像體素的空間排列評估腫瘤的異質性,從而產(chǎn)生定量信息,用于協(xié)助腫瘤的診斷和治療[6]。近年對影像組學在臨床中應用的研究非常廣泛。夏婷等[7]通過提取術前動態(tài)增強CT圖像的影像組學特征并構建了關于腫瘤病理分級的預測模型,效能良好。梁翠珊等[8]構建術前影像組學模型預測結直腸癌的淋巴血管侵犯具有較好的效能,并且結合臨床因子后使得組學模型的效能進一步提升。上述研究表明通過影像組學構建模型無論是獨立應用或與臨床結合,均有深遠的探索意義。但通過影像組學預測骨巨細胞瘤復發(fā)的研究鮮有報道。由此可見通過影像組學預測骨巨細胞瘤的復發(fā)具有一定的臨床需求,且具有可行性。盡管各地區(qū)的CT設備及掃描技術很難完全一致,導致各地區(qū)掃描圖像中存在技術相關的異質性(噪聲和偽影)[9],但部分研究發(fā)現(xiàn)在CT紋理特征具有較高異質性的前提下,基于CT的放射組學分析的差異性不大[10-12]。Yin等[13]對骨盆軟骨肉瘤進行影像組學回顧性研究,結果證實基于mpMRI影像組學特征在預測骨盆軟骨肉瘤早期復發(fā)方面具有良好的表現(xiàn);Wang等[3]的研究顯示基于CT影像組學特征預測脊柱骨巨細胞瘤的早期復發(fā)具有良好的表現(xiàn)。
3.2 影像組學特征分析 從篩選的幾個特征中,一階直方圖特征包含均值和偏度,反映了圖像的異質性。而紋理特征則包含了灰度尺寸區(qū)域矩陣(GLSZM)、灰度共生矩陣(GLCM)、灰度級運行長度矩陣(GLRLM)、灰度依賴性矩陣(GLDM)。從定義來看,GLDM量化了圖像中的灰度依賴性,它定義為依賴于中心體素的特定距離內(nèi)連接體素的數(shù)量。GLSZM量化了圖像中的灰度區(qū)域,定義為具有相同灰度強度的連接體素的數(shù)量。GLCM是高級紋理特征,是建立在預估圖像的二階組合條件概率密度基礎上的方法。GLRLM是基于GLCM某一像素值沿某一方向游行的長度所組成的矩陣[14]。上述紋理分析的一個缺點是特征的提取僅能依賴計算機算法。盡管如此,腫瘤的紋理可以顯示腫瘤的異質性,這與腫瘤潛在的生物學行為相關,而影像組學分析則或許可以提供這一相關性的線索。
3.3 影像組學模型效能 本研究采用LR及RF模型。影像組學在腫瘤復發(fā)和預測研究中已經(jīng)有很多研究,并通過不同的模型分別驗證了影像組學特征的效能。既往研究顯示LR和RF模型對于小樣本數(shù)據(jù)有很好的穩(wěn)定性和準確性,并且得到廣泛應用[15-16]。但RF存在一定的過擬合問題。Yin等[15]通過術前影像組學特征、預測骨盆腫瘤的良惡性研究中,對比了多種模型的效能,結果顯示LR的結果更優(yōu)于RF。目前使用影像組學預測腫瘤復發(fā)的研究較為廣泛,但針對骨巨細胞瘤的研究較少[3]。盡管Wang等[3]的研究顯示影像組學預測脊柱骨巨細胞瘤的早期復發(fā)具有良好的表現(xiàn),但樣本量較小,僅62例,并且僅使用支持向量機模型預測研究結果。既往基于CT影像組學的研究在肺癌與甲狀腺癌的鑒別中構建了RF、LR和支持向量機3種模型,結果顯示支持向量機的模型效能較其他兩者稍差,而RF的模型效能最優(yōu)[17-18]。本研究使用并對比了LR和RF模型,均具有很好的結果,進一步驗證了影像組學評估預測骨巨細胞瘤具有很好的效能,有望為臨床盡早制訂個體化治療方案提供幫助。
3.4 本研究的局限性 首先,本研究納入樣本量較小。其次,該隊列患者中,由于發(fā)病部位不同,導致治療方法與手術選擇不同。本研究95例患者中,11例行病灶刮除,84例行根治性切除術,術式不同和術者的不同可能是一個比較重要的干擾因素。盡管有研究顯示基于Ki-67[19]、RANK/RANKL/OPG[20]、IMP3/IGF2[21]、P53[22]等分子生物學標志物檢查,有助于預測骨巨細胞瘤的復發(fā)風險,并表示骨巨細胞瘤術后復發(fā)并不能完全歸因于手術過程的不完整切除,后續(xù)研究將擴大樣本量并按照發(fā)病部位、術式進行分類研究。第三,本研究僅分析了術前CT平掃圖像,并未采集CT增強及MR的圖像。一方面,胡奎等[23]研究認為碘對比劑強化程度在一定范圍內(nèi),對CT組學的影像特征穩(wěn)定性產(chǎn)生影響。本研究為避免更多的干擾因素,選擇CT平掃圖像進行數(shù)據(jù)提取。另一方面,樣本中并非每一例患者均有增強CT圖像資料。為保證樣本量的完整性,選擇了基數(shù)更大的CT平掃圖像。Yin等[16]的研究中描述了基于MR T1WI、T2WI及表觀擴散系數(shù)3個序列建立預測骨盆軟骨肉瘤早期復發(fā)模型具有很好的表現(xiàn),在結合臨床特征后該模型的效能明顯提升;也闡明了應用影像組學特征鑒別骶骨脊索瘤和骨巨細胞瘤具有良好的表現(xiàn),結合臨床特征后該模型效能亦得到很高的提升[24]。與前者研究相比,本研究樣本量較小,且添加的臨床標簽不夠充分(僅包括年齡、性別、發(fā)病部位),很多已經(jīng)得到證實的臨床特征因素在組學特征降維過程中被篩除,最終保留的穩(wěn)定特征僅包含影像組學特征,導致結果并未提示臨床標簽對組學模型有優(yōu)化作用。
總之,本研究對影像組學特征進行定量分析,探討基于術前CT影像組學模型預測骨巨細胞瘤術后復發(fā)的可行性。研究結果表明基于術前CT圖像提取的影像組學特征預測骨巨細胞瘤復發(fā)具有良好的效能。這將有助于制訂個性化的診療策略與隨訪方案,給予臨床更合理的治療建議。