資欣月,董林娟,許俊鋒,張承志,劉新
腮腺腫瘤中約80%為良性,多形性腺瘤(pleomorphic adenoma,PA)是其中最常見的良性腫瘤[1],基底細(xì)胞腺瘤(basal cell adenoma,BCA)是較為常見的良性上皮源性腫瘤,占涎腺上皮性腫瘤的1%~7%[2]。PA與BCA的臨床表現(xiàn)及影像學(xué)特點有諸多相似之處,鑒別診斷有一定困難。由于PA有很高的復(fù)發(fā)傾向和惡性轉(zhuǎn)化發(fā)生率[3],術(shù)前準(zhǔn)確鑒別PA和BCA對手術(shù)方法的選擇以及患者的預(yù)后均具有重要意義。細(xì)針穿刺活檢是一種臨床常用的腮腺腫瘤術(shù)前檢查方法,但也具有一定的缺點,如診斷性抽吸不充分的發(fā)生率較高,而且有繼發(fā)性面神經(jīng)麻痹的風(fēng)險[4]。CT的優(yōu)勢在于其廣泛的可用性、能快速完成檢查且經(jīng)濟實惠[5]。放射組學(xué)可以從醫(yī)學(xué)圖像中提取高維特征,能提供更全面的腫瘤相關(guān)病理生理學(xué)信息,從而可提高對影像的術(shù)前診準(zhǔn)確性[6]。本研究基于CT平掃和雙期(動脈期及靜脈期)增強圖像提取腫瘤的影像組學(xué)特征,并聯(lián)合臨床資料建立聯(lián)合診斷模型,旨在提高對PA和BCA的鑒別診斷效能,為臨床決策提供準(zhǔn)確依據(jù)。
1.一般資料
回顧性分析2020年1月-2022年8月在本院就診的腮腺腫瘤患者的臨床和影像資料。納入標(biāo)準(zhǔn):①經(jīng)病理證實腮腺腫瘤為PA或BCA ;②術(shù)前影像資料(CT平掃及增強檢查)完整;③病灶最大直徑>5 mm。排除標(biāo)準(zhǔn):①圖像質(zhì)量不符合診斷要求;②合并其它腮腺腫瘤性病變;③臨床資料不完整。最終共將117例符合研究要求的患者納入本研究,其中PA 88例,BCA 29例。PA組患者年齡10~71歲,平均(41.2±13.1)歲 ,病灶最大直徑0.8~4.2 cm,平均(2.1±0.8)cm;BCA組患者年齡20~70歲,平均(50.4±11.4)歲,病灶最大直徑0.6~3.2 cm,平均(1.8±0.7)cm。按照7∶3的比例進行隨機分層抽樣,將全部患者分為訓(xùn)練集(n=81)和測試集(n=36)。
2.CT掃描方法
使用Siemens Somatom go.Top 64排螺旋CT機,所有患者行CT平掃和增強掃描。掃描參數(shù):120 kV,層厚5 mm,層距5 mm,掃描范圍為外耳道下緣至下頜角水平。行CT平掃后,經(jīng)肘靜脈以3.0 mL/s的流率注射對比劑碘海醇(300 mg I/mL),注射對比劑30~50 s后行增強掃描。
3.臨床資料和常規(guī)CT圖像分析
分析腫瘤的臨床資料和CT征象,包括病灶數(shù)目、質(zhì)地、部位(淺葉、深葉)、密度(囊性、實性及囊實性)最大直徑、鈣化及同側(cè)淋巴結(jié)腫大(直徑≥1 cm)等。在各期相(平掃、動脈期及靜脈期)圖像上測量病灶的CT值,感興趣區(qū)面積25 mm2,每個病灶測量3次后取平均值;計算動脈期CT強化值(動脈期CT值-平掃期CT值)和靜脈期強化值(靜脈期CT值-平掃期CT值)。
4.影像組學(xué)分析
病灶分割:由2位影像科醫(yī)師共同商議確定病灶邊緣,當(dāng)意見不一致時由上級醫(yī)師最終確定。利用3D Slicer軟件(https://www.slicer.org/),分別在平掃、動脈期及靜脈期圖像上沿病灶邊緣逐層勾畫二維ROI,軟件即可自動融合生成病灶的三維容積感興趣區(qū)(volume of interest,VOI),用于后續(xù)的特征提取(圖1~2)。
圖1 PA患者,26歲,女性。a)CT平掃,示右側(cè)腮腺內(nèi)有一圓形低密度結(jié)節(jié)(黃箭),邊界清晰,邊緣光整,與周圍結(jié)構(gòu)分界清楚,沿病灶邊緣勾畫ROI;b)動脈期圖像,示病灶無明顯強化,沿病灶邊緣勾畫ROI;c)靜脈期圖像,示病灶呈不均勻輕度強化,可見斑點狀無強化區(qū),沿病灶邊緣勾畫ROI;d)軟件自動融合生成病灶的VOI。 圖2 BCA患者,67歲,男性。a)CT平掃,示右側(cè)腮腺內(nèi)有一類圓形低密度結(jié)節(jié),邊界清晰,邊緣光整,與周圍結(jié)構(gòu)分界清楚,沿病灶邊緣勾畫ROI(黃線);b)動脈期,中度不均勻強化,沿病灶邊緣勾畫ROI;c)靜脈期,強化程度高于動脈期,沿病灶邊緣勾畫ROI;d)軟件自動融合生成病灶的VOI。
圖像預(yù)處理及特征提取:利用3D Slicer軟件的Pyradiomics工具包對圖像進行重采樣預(yù)處理,重采樣體素大小為1 mm×1 mm×1 mm,并將圖像標(biāo)準(zhǔn)化。提取特征時設(shè)置可提取圖像類型為原始圖像,提取的影像組學(xué)特征主要包括18個一階特征、14個形態(tài)特征和75個紋理特征。
特征篩選和模型構(gòu)建:采用Python 3.7軟件,此過程主要包括4個步驟。首先,由于數(shù)據(jù)集類別分布不平衡,采用上采樣技術(shù)對數(shù)據(jù)集進行處理來平衡數(shù)據(jù);然后,采用Z-score法將數(shù)據(jù)進行標(biāo)準(zhǔn)化處理;第三步,使用Spearman相關(guān)性分析剔除相關(guān)性系數(shù)|r|>0.7的冗余特征;最后,將剩余特征進一步采用互信息法和遞歸特征消除法進行特征篩選,獲得最佳影像組學(xué)特征,用于構(gòu)建logstic回歸影像組學(xué)模型,并計算影像組學(xué)評分(Radscore),其計算公式:Radscore=I+β1×W1+β2×W2+β3×W3+......(I表示截距,β表示篩選出的各項最佳組學(xué)特征的數(shù)值,W表示各特征對應(yīng)系數(shù))。
5.統(tǒng)計學(xué)分析
使用SPSS 26.0和R3.6.1軟件進行統(tǒng)計學(xué)分析。符合正態(tài)分布的數(shù)據(jù)以均數(shù)±標(biāo)準(zhǔn)差表示,組間比較采用兩獨立樣本t檢驗;計數(shù)資料采用中位數(shù)(P25,P75)來表示,組間比較采用卡方檢驗。
將自變量(臨床資料和常規(guī)CT征象)中組間比較差異有統(tǒng)計學(xué)意義(P<0.05)的三項指標(biāo)(年齡、動脈期強化值和靜脈期強化值)納入logistic回歸分析構(gòu)建臨床模型。采用受試者工作特征曲線(receiver operation characteristic curve,ROC)分析各模型的診斷效能,計算曲線下面積(area under ROC curve,AUC)、敏感度、特異度、符合率、陽性和陰性預(yù)測值。采用Delong檢驗比較各單期相組學(xué)模型間AUC的差異,并采用連續(xù)凈重分類改善度(net reclassification improvement,NRI)和綜合區(qū)分改善度(integrated discrimination improvement,IDI)兩項指標(biāo)來兩兩比較各模型對分類效能的改善能力,NRI>0且IDI>0表示正向改善,篩選出最優(yōu)的影像組學(xué)模型,然后與臨床模型構(gòu)建聯(lián)合模型?;诼?lián)合模型,利用R軟件的rms及survival軟件包繪制其列線圖,采用boostrap自助抽樣法重復(fù)抽樣500次,繪制列線圖的校準(zhǔn)曲線分析模型與實際情況之間的擬合效果,并繪制決策曲線評估列線圖的臨床應(yīng)用價值。
1.臨床資料和常規(guī)CT征象
訓(xùn)練集和測試集中患者的臨床資料和常規(guī)CT征象見表1。訓(xùn)練集和測試集中,BCA組的患者年齡、動脈期及靜脈期CT強化值均明顯大于PA組,組間差異均有統(tǒng)計學(xué)意義(P<0.05)。
表1 訓(xùn)練集和測試集的臨床資料和常規(guī)CT征象
2.影像組學(xué)特征篩選及模型構(gòu)建
經(jīng)過特征篩選,基于CT平掃、動脈期和靜脈期圖像分別獲得了7個、8個和8個最佳組學(xué)特征,將其分別納入邏輯回歸分析,分別建立基于3期圖像的影像組學(xué)回歸模型并獲得相應(yīng)的Radscore計算公式,3個模型中截距分別為2.192、2.941和2.302,各項特征在模型中的系數(shù)詳見表2。
表2 各期相最終篩選的特征及其系數(shù)
3.各模型診斷效能評估
首先,在訓(xùn)練集和測試集中分別根據(jù)平掃模型、動脈期模型和靜脈期模型的預(yù)測概率繪制ROC曲線(圖3),并計算出各模型的AUC及診斷效能指標(biāo)指標(biāo)值,詳見表3。進一步采用Delong檢驗分別在訓(xùn)練集和測試集中比較各單期模型之間AUC值的差異,結(jié)果顯示:平掃與動脈期模型(訓(xùn)練集:Z=1.547,P=0.1219;測試集:Z=0.857,P=0.391)、平掃與靜脈期模型(訓(xùn)練集:Z=0.880,P=0.379;測試集:Z=0.084,P=0.932)、動脈期與靜脈期模型(訓(xùn)練集:Z=1.350,P=0.177;測試集:Z=0.495,P=0.620)之間AUC值的差異均無統(tǒng)計學(xué)意義(P均>0.05)。
表3 各模型在訓(xùn)練集與測試集的鑒別診斷效能
隨后,計算各單期模型的NRI及IDI,結(jié)果見表4。在訓(xùn)練集和測試集中動脈期模型均較平掃和靜脈期模型具有正向改善力(NRI>0且IDI>0),說明動脈期模型在鑒別兩種腫瘤方面較平掃及靜脈期模型更有優(yōu)勢,故選擇動脈期影像組學(xué)評分與臨床模型構(gòu)建聯(lián)合模型。
表4 各模型間診斷效能比較的NRI及IDI
聯(lián)合模型和臨床模型的診斷效能分析結(jié)果見圖3、表3。統(tǒng)計分析結(jié)果顯示聯(lián)合模型診斷效能優(yōu)于臨床模型。進一步采用Delong檢驗對這2個模型及其與各單期影像組學(xué)模型在訓(xùn)練集和測試集中的AUC進行比較,結(jié)果顯示,僅在訓(xùn)練集中聯(lián)合模型與臨床模型之間AUC值的差異具有統(tǒng)計學(xué)意義(Z=2.176,P=0.0296),其余各模型間AUC值的差異均無統(tǒng)計學(xué)意義(P>0.05)。NRI及IDI分析結(jié)果顯示在訓(xùn)練集和測試集中聯(lián)合模型較動脈期模型和臨床模型均具有正向改善力(表4)。
繪制聯(lián)合模型的列線圖(圖4),其校準(zhǔn)曲線顯示在訓(xùn)練集和測試集中的平均絕對誤差分別為0.069和0.060(圖5),表明列線圖預(yù)測概率與病理結(jié)果間一致性較高,預(yù)測的效果良好。決策曲線顯示列線圖較其它模型的風(fēng)險閾值范圍更寬(圖6),具有更高的臨床凈收益,表明列線圖具有較好的臨床應(yīng)用價值。
圖4 聯(lián)合模型鑒別診斷PA與BCA的列線圖。 圖5 列線圖的校準(zhǔn)曲線。a)訓(xùn)練集中,模型預(yù)測值與樣本真實值之間的平均絕對誤差為0.069,表明聯(lián)合模型擬合效果較好;b)測試集,模型預(yù)測值與樣本真實值之間的平均絕對誤差為0.060,表明聯(lián)合模型擬合效果較好。 圖6 臨床模型、動脈期模型及聯(lián)合模型列線圖的決策曲線。a)訓(xùn)練集中,聯(lián)合模型曲線高于臨床模型及動脈期模型,聯(lián)合模型鑒別腮腺BCA與PA的凈收益較高;b)測試集中,聯(lián)合模型曲線高于臨床模型及動脈期模型,聯(lián)合模型對腮腺BCA與PA鑒別診斷的凈收益較高。
在臨床診療中準(zhǔn)確鑒別PA與BCA具有重要的臨床意義,術(shù)前準(zhǔn)確診斷對指導(dǎo)臨床制訂個體化的治療計劃和改善患者的預(yù)后具有重要作用[7]。PA具有腫瘤復(fù)發(fā)風(fēng)險,高達(dá)5%~15%的病例可轉(zhuǎn)化為惡性腫瘤,而BCA除了膜性亞型(組織學(xué)表現(xiàn)為外周細(xì)胞呈柵欄狀排列,由玻璃樣變的基底膜樣物質(zhì)圍繞)外,很少復(fù)發(fā),未見其出現(xiàn)惡性轉(zhuǎn)化的報道[8]。PA的主要治療方法是切除腫瘤周圍的腮腺組織以及毗鄰面神經(jīng)的腫瘤的完整包膜[8]。與PA不同,BCA通常更易累及鄰近的腮腺組織,臨床上通常建議采取包膜外單純挖除瘤體的手術(shù)方式[9]。PA與BCA的臨床表現(xiàn)類似,均以女性患者較多見,病變進展緩慢,一般無明顯臨床癥狀,多因無意中發(fā)現(xiàn)腮腺區(qū)無痛性腫塊而就診[10]。有文獻報道,PA患者的平均年齡為40~50歲,較BCA患者的平均年齡小10歲左右[11]。PA與BCA在CT平掃圖像上均表現(xiàn)為腮腺良性腫瘤的特征,包括呈橢圓形或圓形腫塊、邊界清晰、推擠周圍結(jié)構(gòu)而無浸潤性生長的趨勢[12]。PA的密度較均勻,增強后腫瘤實質(zhì)邊緣強化程度高于中央?yún)^(qū),動脈期強化程度稍低于靜脈期,即呈現(xiàn)緩慢持續(xù)強化的特點;BCA最明顯的特點是易發(fā)生出血、壞死和囊變,在平掃及增強圖像上其CT值均高于PA[13]。本項研究中,BCA組動脈期強化值為40.2(13.3,57.4)HU,明顯高于PA組[10.9(5.6,14.9)HU],與上述研究結(jié)果相符。
影像組學(xué)通過提取和分析高通量圖像特征,能無創(chuàng)性反映腫瘤組織的異質(zhì)性[14],為疾病的動態(tài)監(jiān)測、預(yù)后預(yù)測和治療決策提供了可能性[15]。目前的研究結(jié)果顯示,就提取的影像組學(xué)特征的可重復(fù)性和穩(wěn)定性而言,CT圖像最有優(yōu)勢[5]。Jung等[16]基于CT紋理特征分析方法來鑒別PA與腺淋巴瘤,結(jié)果顯示紋理參數(shù)的診斷效能與單期掃描無顯著差異,但是始終優(yōu)于放射科醫(yī)師的視覺評估。這也說明影像組學(xué)對于腮腺腫瘤的鑒別診斷具有一定價值。
本研究中BCA組的病例數(shù)偏少,為了解決數(shù)據(jù)不平衡的問題,我們通過上采樣來建立數(shù)據(jù)集,使用遞歸特征消除法和交互信息法來篩選特征。互信息法衡量特征與標(biāo)簽之間的相互依賴性,從而避免過擬合,并在訓(xùn)練隊列中選擇候選特征[14]。遞歸特征消除法,使用所有特征變量來訓(xùn)練模型,計算每個特征變量的重要性并進行排序,選擇最優(yōu)特征變量集合并以其構(gòu)建的模型作為最終模型。有文獻報道,利用遞歸特征消除程序執(zhí)行分類任務(wù)是可行的,并且結(jié)果更可靠[17]。Wang等[18]的研究結(jié)果顯示,在肺部良惡性病變的鑒別診斷中,相較于t檢驗、最小絕對收縮選擇算子以及互信息特征選擇法,遞歸特征消除法表現(xiàn)出更好的優(yōu)勢。
有研究結(jié)果顯示,提取的影像組學(xué)特征中60%具有重復(fù)性[6]。此次研究使用Pyradiomics工具規(guī)范化提取影像組學(xué)特征。建立強大的預(yù)測模型的關(guān)鍵是選擇有效的指標(biāo)和建模方法。由于BCA與PA的強化方式各有特點,本研究中我們基于CT平掃和雙期增強圖像分別提取影像組學(xué)特征。經(jīng)特征篩選后,保留了基于平掃圖像的7個組學(xué)特征,基于動、靜脈期的各8個特征?;谶@些特征,分別構(gòu)建了各期相的影像組學(xué)模型。Delong檢驗結(jié)果顯示,各單期相模型之間AUC值的差異均無統(tǒng)計學(xué)意義(P>0.05),但NRI及IDI分析結(jié)果顯示在訓(xùn)練集和測試集中動脈期模型較平掃和靜脈期模型均具有正向改善力(NRI>0且IDI>0)。NRI更關(guān)注某個界值時兩個模型的優(yōu)劣,IDI考慮不同界值的情況,反映兩個模型預(yù)測概率的差距,彌補了NRI的局限性,兩者均較AUC等指標(biāo)更敏感,現(xiàn)被廣泛應(yīng)用于兩個模型診斷效能的比較。
在單相期模型中,動脈期模型最優(yōu),這可能是因為多形性腺瘤是相對乏血供的腫瘤,早期強化不明顯,而基底細(xì)胞腺瘤由大量沿內(nèi)皮排列的血管網(wǎng)(毛細(xì)血管和靜脈)構(gòu)成,動脈期有明顯強化[19],增強掃描的強化特點有助于兩者的鑒別。吳艷等[20]基于T2WI影像組學(xué)保留8個紋理特征并與病灶的臨床特點建立聯(lián)合模型,聯(lián)合模型對PA與腺淋巴瘤的鑒別診斷價值(ROC曲線下面積)明顯高于影像組學(xué)模型。本研究中將有統(tǒng)計學(xué)意義的臨床指標(biāo)(如年齡)及常規(guī)CT征象(動靜脈期強化值)用于構(gòu)建臨床模型,并聯(lián)合動脈期影像組學(xué)模型和臨床模型建立聯(lián)合模型,結(jié)果顯示,聯(lián)合模型(訓(xùn)練集AUC=0.969;測試集AUC=0.889)的診斷效能明顯優(yōu)于動脈期模型(訓(xùn)練集AUC=0.954;測試集AUC=0.881)及臨床模型(訓(xùn)練集AUC=0.893;測試集AUC=0.872)。列線圖將聯(lián)合模型進行可視化處理,聯(lián)合模型的臨床凈效益明顯高于單相期模型和臨床模型,在PA與BCA兩者的鑒別診斷中更有價值。校準(zhǔn)曲線顯示在訓(xùn)練集及測試集中聯(lián)合模型的預(yù)測概率與病理結(jié)果的一致性較高,預(yù)測效果良好。與鄭韻琳等[22]研究相比,本研究有以下幾點優(yōu)勢:①增加了動靜脈期CT強化值,能更客觀反映病灶的強化方式;②采用遞歸特征消除法及互信息法篩選特征更有優(yōu)勢;③利用NRI和IDI更直觀地比較各模型間的診斷效能。
綜上所述,各期相影像組學(xué)模型和臨床模型對PA和BCA的診斷效能均較好,而聯(lián)合模型的診斷效能更優(yōu),聯(lián)合模型的列線圖能直觀、準(zhǔn)確地對PA與BCA進行預(yù)測,對輔助臨床決策具有較高的價值。
本研究存在的一定的局限性:①系單中心小樣本研究,數(shù)據(jù)模型缺乏外部驗證,可能會高估模型的診斷效能,后續(xù)有條件將開展多中心研究擴充樣本量并進一步驗證模型的效能,以期能應(yīng)用于臨床診療過程中。②影像組學(xué)特征的提取僅限于CT平掃、動脈期及靜脈期圖像,后續(xù)有待加入延遲期圖像以及納入更多的臨床資料來組建聯(lián)合模型,進一步分析聯(lián)合模型的診斷價值。