劉增建 楊帆 張濱 徐井旭 黃陳翠 李萬蘭 唐美榮
腎透明細(xì)胞癌(Clear cell renal cell carcinoma,ccRCC)是腎細(xì)胞癌(Renal cell carcinoma,RCC)占比最多的亞型(約70%),此外,ccRCC 是惡性程度高、預(yù)后差、死亡率最高的亞型[1~4]。世界衛(wèi)生組織/國(guó)際泌尿病理學(xué)會(huì)(WHO/ISUP)分級(jí)系統(tǒng)根據(jù)核仁突出情況進(jìn)行分級(jí),核等級(jí)不僅可以反映ccRCC 侵襲性,也可作為ccRCC 預(yù)后的重要指標(biāo)[5]。術(shù)前經(jīng)皮穿刺活檢因腫瘤本身異質(zhì)性存在取樣偏差,其結(jié)果的準(zhǔn)確性和代表性受到限制。影像組學(xué)作為新興的且非侵入性診斷及評(píng)估方法,對(duì)傳統(tǒng)醫(yī)學(xué)影像圖像進(jìn)行分割、特征提取,量化分析圖像異質(zhì)性,客觀地實(shí)現(xiàn)臨床在術(shù)前預(yù)測(cè)腫瘤類型與病理分級(jí)[6]。
本研究旨在探討利用傳統(tǒng)CT 平掃圖像構(gòu)建影像組學(xué)術(shù)前模型預(yù)測(cè)ccRCC WHO/ISUP分級(jí)的價(jià)值,并尋求構(gòu)建高準(zhǔn)確度的預(yù)測(cè)模型。
1.1 一般資料 回顧性分析我院收治且符合以下標(biāo)準(zhǔn)的研究對(duì)象資料。納入標(biāo)準(zhǔn):①術(shù)后病理證實(shí)為ccRCC 的患者;②術(shù)前進(jìn)行腎臟CT 平掃檢查;③術(shù)前未進(jìn)行穿刺活檢及其他抗腫瘤相關(guān)治療。排除標(biāo)準(zhǔn):①術(shù)前2 周以上CT 平掃檢查;②CT 層厚未達(dá)5mm;③CT 平掃圖像資料不全或存在偽影,或圖像質(zhì)量不能滿足診斷和校準(zhǔn)要求。201 例患者共203 枚病灶納入研究,其中男136 例,女65 例,年齡27~83 歲,平均(55.6±12.4)歲。
1.2 病理學(xué)分組 納入研究病例術(shù)后組織病理切片均進(jìn)行HE 染色,并由兩名泌尿系腫瘤診斷病理科醫(yī)師(7年和11年診斷經(jīng)驗(yàn))復(fù)閱,依據(jù)2016 版腎癌WHO/ISUP 分級(jí)標(biāo)準(zhǔn),對(duì)病理學(xué)切片進(jìn)行重新診斷、分級(jí)[5]。根據(jù)患者不同預(yù)后結(jié)局[5]分為低級(jí)別組(Ⅰ~Ⅱ級(jí))和高級(jí)別組(Ⅲ~Ⅳ級(jí))。
1.3 掃描方法 使用螺旋CT 進(jìn)行數(shù)據(jù)采集,范圍為膈頂至恥骨聯(lián)合,具體機(jī)器型號(hào)、掃描參數(shù)和掃描病灶數(shù),見表1。
表1 CT 掃描機(jī)參數(shù)與掃描病灶數(shù)
1.4 CT 圖像分析與特征提取 將所有CT 平掃數(shù)據(jù)導(dǎo)入Deepwise 科研平臺(tái)(深睿醫(yī)療),逐層手動(dòng)勾畫ccRCC 病灶輪廓,產(chǎn)生3D 腫瘤感興趣區(qū)(Region of interest,ROI),3D-ROI 病灶內(nèi)壞死、囊變、包膜及鈣化區(qū)域;為了提高CT 圖像分割時(shí)的準(zhǔn)確性,所有病灶近腎盂側(cè)邊緣均參考同期排泄期,遠(yuǎn)腎盂側(cè)邊緣的確定均參考同期皮質(zhì)期圖像。為避免部分溶劑效應(yīng)干擾,3D-ROI 外緣在病灶邊緣以內(nèi)1~2mm。由兩名放射科醫(yī)師(6年和15年診斷經(jīng)驗(yàn))分別對(duì)CT 平掃圖像進(jìn)行靶區(qū)分割,并提取影像組學(xué)特征;21d 后,由低年資醫(yī)師再次對(duì)上述患者提取影像組學(xué)特征,并且計(jì)算觀察者間及觀察者內(nèi)相關(guān)系數(shù)(ICC)。為避免不同掃描CT 儀器中不同參數(shù)設(shè)置造成的灰度不均勻性,在進(jìn)行特征選擇之前對(duì)所有CT 掃描圖像進(jìn)行歸一化處理,所有CT 掃描圖像在三個(gè)方向上重新采樣至5mm 分辨率,以標(biāo)準(zhǔn)化患者的體素大??;為使每個(gè)區(qū)域提取表征腫瘤強(qiáng)度和結(jié)構(gòu)的放射學(xué)特征,對(duì)腫瘤區(qū)域進(jìn)行8 個(gè)方向的小波變換。處理后的特征均值為0,方差為1。
影像組學(xué)特征包含基于10 種圖像預(yù)處理(原始、小波變換、LoG、Square、SquareRoot、Logarithm、Exp-onential、Gradient、LBP2D、LBP3D)的7 類共2 107 個(gè)特征,包含一階特征、形狀特征、灰度相依矩陣特征、灰度共生矩陣特征、灰度游程矩陣特征、灰度區(qū)域矩陣特征(GLSZM Features)及鄰域灰度差分矩陣特征。
1.5 模型構(gòu)建 利用Pearson 相關(guān)系數(shù)(Pearson correlation coe-fficients,PCC)構(gòu)建相關(guān)矩陣,以此降低影像組學(xué)特征之間的冗余性。當(dāng)訓(xùn)練集上任意兩個(gè)自變量之間的r>0.95時(shí),將剔除其中的一個(gè)特征,優(yōu)先保留和因變量的線性相關(guān)系數(shù)較高的特征。使用十折交叉驗(yàn)證法進(jìn)行分類判別,進(jìn)行10 次循環(huán),以便于每個(gè)部分?jǐn)?shù)據(jù)均可用于訓(xùn)練模型。分別使用5 個(gè)分類器(SVM、Decision Tree、XG Boost、Linear SVC、Logistic Regression)對(duì)篩選出來的特征值進(jìn)行分類并建立模型。通過超參搜索,尋找當(dāng)前模型較優(yōu)的特征篩選(降維)算法及其參數(shù),從而得到較好的結(jié)果?;诜讲罘治龅奶卣骱Y選(ANOVA F-value),具有顯著性差異的特征被認(rèn)為對(duì)分類具有較高區(qū)分度,將被保留。特征選擇參數(shù)為1%。
1.6 統(tǒng)計(jì)學(xué)分析 采用R 語言統(tǒng)計(jì)分析軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,對(duì)基于CT 平掃圖像提取的影像組學(xué)特征進(jìn)行兩獨(dú)立樣本Mann-Whitney U 檢驗(yàn),從而獲取對(duì)鑒別低級(jí)別和高級(jí)別ccRCC 差異有統(tǒng)計(jì)學(xué)意義的特征集。計(jì)數(shù)參數(shù)比較采用χ2檢驗(yàn)。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。采用受試者工作特征(ROC)曲線及校準(zhǔn)曲線對(duì)不同組別模型分類效能進(jìn)行評(píng)價(jià),參數(shù)值為對(duì)應(yīng)曲線下面積(AUC)、敏感性、準(zhǔn)確度、精確度及特異性。模型校準(zhǔn)度的評(píng)價(jià)使用Hosmer-Lemeshow 擬合優(yōu)度檢驗(yàn)。對(duì)測(cè)試集影像組學(xué)評(píng)分的預(yù)測(cè)模型采用決策曲線分析不同概率閾值下的患者凈獲益。
2.1 一般資料 WHO/ISUP 低級(jí)別組147 枚(Ⅰ級(jí)55 枚,Ⅱ級(jí)92 枚),其中男98 枚,女49 枚,患者平均年齡(55.8±11.7)歲,左腎68 枚,右腎79 枚;高級(jí)別組病灶數(shù)為56 枚(Ⅲ級(jí)34 枚,Ⅳ級(jí)22 枚),其中男39 枚,女17 枚,患者平均年齡(54.9±14.2)歲,左腎26 枚,右腎30 枚。兩組年齡、性別、發(fā)病部位及病理分級(jí)比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。本研究中觀察者間組間ICC 為0.85,觀察者內(nèi)ICC 為0.92,手工標(biāo)注圖像一致性較好。
2.2 特征選擇及模型特征 經(jīng)過一系列智能調(diào)整參數(shù),查詢各種參數(shù)組合獲取的人工智能模型中,基于L1 正則化的特征篩選項(xiàng)C=0.4504,當(dāng)常量不添加至決策函數(shù)時(shí),二分類模型——邏輯回歸(Logistic regression,LR)模型在訓(xùn)練集十折交叉驗(yàn)證所得平均AUC 值最高。本實(shí)驗(yàn)中,采用觀察者間和觀察者內(nèi)相關(guān)系數(shù)評(píng)判一致性(ICC ≥0.75),首先初步保留了1 995 個(gè)特征(ICC:0.7581~0.999),在經(jīng)過PCC 的選擇后,保留483 個(gè)獨(dú)立并相關(guān)性強(qiáng)的影像組學(xué)特征。在LR 模型中,通過監(jiān)督學(xué)習(xí)來估計(jì)模型參數(shù),最終篩選出5 個(gè)非零回歸系數(shù)的與ccRCC 病理等級(jí)強(qiáng)相關(guān)的預(yù)測(cè)特征,模型方程為:Logit=0.3487×[original_shape_Maximum2DDiameterSlice(最大2D 直徑)]+0.6251×[log-sigma-5-0-mm-3D_glszm_ZoneEntropy(區(qū) 域 熵)]+{(-0.6138)×[logsigma-4-0-mm-3D_gldm_DependenceVariance(相關(guān)方差)]}+0.0471×[log-sigma-4-0-mm-3D_glszm_GrayLevelNonUniformity(灰度不均勻性)]+0.7139×[squareroot_firstorder_Mean(平均值)]+(-0.5675)。訓(xùn)練集、測(cè)試集Hosmer-Lemeshow 擬合優(yōu)度檢驗(yàn)結(jié)果表明,該預(yù)測(cè)模型均有較好的校準(zhǔn)度(χ2=5.364,P=0.718;χ2=12.471,P=0.104)。
在本研究中LR 分類模型里,最終提取5 個(gè)高權(quán)重特征參數(shù),并且根據(jù)上述5 個(gè)特征及系數(shù)的線性加權(quán)建立影像組學(xué)標(biāo)簽,得出每例患者的Radscore。其中低、高級(jí)別影像組學(xué)風(fēng)險(xiǎn)評(píng)分在訓(xùn)練集分別為(-1.59±1.89)分和(1.94±2.75)分,差異有統(tǒng)計(jì)學(xué)意義(t=-6.752,P<0.05)。低、高級(jí)別影像組學(xué)風(fēng)險(xiǎn)評(píng)分在測(cè)試集分別為(-2.14±2.12)分和(1.65±2.12)分,差異有統(tǒng)計(jì)學(xué)意義(t=-4.621,P<0.05)。此時(shí),該模型訓(xùn)練集預(yù)測(cè)高級(jí)別ccRCC的準(zhǔn)確度為82.35%、精確度為63.51%,最佳點(diǎn)的敏感性和特異性分別為83.93%和81.76%,AUC為0.893(95%CI:0.8479~0.9381);對(duì)應(yīng)的測(cè)試集準(zhǔn)確度為79.9%、精確度為60.27%,最佳點(diǎn)的敏感性和特異性分別為78.57%和80.41%,AUC 為0.864(95%CI:0.8106~0.9174),見表1。訓(xùn)練集與測(cè)試集ROC 曲線(見圖1、2)。根據(jù)臨床應(yīng)用,LR 模型的決策曲線(見圖3)體現(xiàn)出較好的性能。當(dāng)訓(xùn)練集中高級(jí)別ccRCC 的閾值概率在0~0.89 之間或測(cè)試集中在0~0.97 之間時(shí),影像組學(xué)預(yù)測(cè)ccRCC 病理分級(jí)可使患者凈獲益。通過影像組學(xué)標(biāo)簽繪制能夠預(yù)測(cè)ccRCC 病理分級(jí)的諾模圖(見圖4)。
表1 訓(xùn)練集與測(cè)試集模型指標(biāo)
圖1 LR 模型訓(xùn)練集ROC 曲線
圖2 LR 模型測(cè)試集ROC 曲線
圖3 影像組學(xué)模型在訓(xùn)練集和測(cè)試集ccRCC 患者中的決策曲線
圖4 ccRCC 病理分級(jí)預(yù)測(cè)諾模圖
CTU 是腎透明細(xì)胞癌術(shù)前早期診斷和評(píng)估的常用影像檢查手段之一,但CT 平掃較增強(qiáng)圖像獲取更加便捷和經(jīng)濟(jì),對(duì)于CT 增強(qiáng)禁忌證患者也具有優(yōu)勢(shì),但從CT 平掃圖像獲取的常規(guī)影像特征在精準(zhǔn)診斷和評(píng)估ccRCC 病理分級(jí)中存在風(fēng)險(xiǎn),且存在相應(yīng)主觀性和低特異性[7,8]。目前有學(xué)者基于CT增強(qiáng)圖像的影像組學(xué)構(gòu)建ccRCC WHO/ISUP 分級(jí)(或Fuhrman 分級(jí))的預(yù)測(cè)模型[9~11],雖然對(duì)比劑濃度和注射流速固定,但根據(jù)患者體重計(jì)算對(duì)比劑用量,腎灌注的個(gè)體差異因素未被消除,影響數(shù)據(jù)一致性,此外,鏡下腫瘤血管分布的評(píng)估與病理核分級(jí)沒有明顯相關(guān)性,目前基于CT 增強(qiáng)影像組學(xué)結(jié)果分析缺乏相關(guān)醫(yī)學(xué)解讀,因此,基于CT 平掃影像組學(xué)預(yù)測(cè)ccRCC WHO/ISUP 分級(jí)更具有相對(duì)的合理的醫(yī)學(xué)邏輯解釋。
本研究采用手動(dòng)跟蹤分割病變的輪廓,為盡量避免主觀性偏差,參照皮質(zhì)期和排泄期,逐層確定ROI,獲取全腫瘤3D-ROI,以便更好地全面獲取腫瘤生物學(xué)特點(diǎn)的圖像。在實(shí)驗(yàn)中,采用觀察者間和觀察者內(nèi)相關(guān)系數(shù)≥0.75 評(píng)判一致性,最終篩選出5 個(gè)最有價(jià)值的影像組學(xué)特征,這些特征均為不容易被肉眼識(shí)別的高維特征,其可能獲取腫瘤的異質(zhì)性信息,從而對(duì)治療評(píng)估更加敏感。
本研究的5 個(gè)分類器通過智能調(diào)參狀態(tài)下,比較多個(gè)人工智能模型的分類性能后,確定采用LG模型。通過10 次十折交叉驗(yàn)證法進(jìn)行分類判別,在交叉驗(yàn)證得到代價(jià)函數(shù)最小時(shí)的λ 值,測(cè)試模型就更加接近理想模型,實(shí)現(xiàn)了自動(dòng)選擇特征,使得模型更加容易解釋,最后建立影像組學(xué)的風(fēng)險(xiǎn)評(píng)分。在本研究的LR 模型中,訓(xùn)練集、測(cè)試集中的AUC 值、敏感度、特異度及準(zhǔn)確度均較高,說明基于CT 平掃圖像的影像組學(xué)模型具有較好且穩(wěn)定的預(yù)測(cè)性能;訓(xùn)練集的AUC 值(0.893)略大于測(cè)試集(0.864),顯示了良好的模型泛化能力。
與低級(jí)別組相比,高級(jí)別組ccRCC 腫瘤直徑較大,圖像紋理差異更大,且分布更不均勻,亮暗程度更不均勻,說明高級(jí)別組異質(zhì)性更高,灰度均值以及灰度分布的特點(diǎn)又反映了ccRCC 的侵襲性。相校于低級(jí)別組,造成這種特征參數(shù)不同可能是因?yàn)椋篶cRCC 有豐富的腫瘤血管及小泡狀結(jié)構(gòu),細(xì)胞核存在微觀異質(zhì)性,高級(jí)別ccRCC 腫瘤細(xì)胞密度較大,體積大而不規(guī)則、緊密排列,圖像紋理更加粗糙,以細(xì)胞群為代表的單個(gè)體素灰度值增高;ccRCC腫瘤內(nèi)出現(xiàn)壞死囊變及出血,常更傾向于高級(jí)別ccRCC,囊變壞死區(qū)在某一坐標(biāo)方向上的灰度級(jí)相似度較高,高級(jí)別ccRCC 腫瘤新生血管豐富、迂曲不規(guī)則分布,致使整體紋理分布較紊亂,灰度分布不均[12,13]。在臨床工作中,腫瘤內(nèi)壞死囊變及出血的診斷是基于平掃和增強(qiáng)圖像的聯(lián)合閱片,對(duì)于較小的壞死囊變和出血,因平掃圖像中缺乏肉眼可辨別的密度差而無法確診,這也說明紋理分析對(duì)醫(yī)學(xué)圖像視覺信息進(jìn)行數(shù)學(xué)模型分析獲取定量紋理參數(shù),可用來反映人眼無法明確的病灶病理信息。
本研究亦有一定的局限性:本研究為回顧性研究,樣本量較小,故未對(duì)WHO/ISUP 四級(jí)分別進(jìn)行分析,也欠缺外部驗(yàn)證,后期有待搜集多中心、多樣本進(jìn)行前瞻性深入研究;靶區(qū)的人工勾畫參考了CT增強(qiáng)圖像(動(dòng)脈期、靜脈期及排泄期),腫瘤區(qū)域的自動(dòng)識(shí)別與分割問題有待未來進(jìn)一步研究解決;紋理特征參數(shù)與病理組成差異的相關(guān)性推斷,還需結(jié)合病理組織學(xué)和算法學(xué)進(jìn)行驗(yàn)證。
綜上所述,基于CT 平掃圖像的影像組學(xué)模型能夠?qū)cRCC WHO/ISUP 分級(jí)進(jìn)行術(shù)前預(yù)測(cè),僅通過平掃圖像就可以獲取較多信息來用于病情的診斷、預(yù)測(cè),對(duì)減少患者醫(yī)療費(fèi)用、提高患者的生活質(zhì)量具有重要意義。
中國(guó)現(xiàn)代醫(yī)藥雜志2022年7期