李 明,李 薇,吳林樺,平學(xué)軍,石 惠
(1.陜西中醫(yī)藥大學(xué)附屬醫(yī)院醫(yī)學(xué)影像科,咸陽 712000;2.寧夏醫(yī)科大學(xué),銀川 750004;3.寶雞市中心醫(yī)院放射科,寶雞 721008;4.寧夏醫(yī)科大學(xué)總醫(yī)院放射科,寧夏醫(yī)科大學(xué)第一臨床醫(yī)學(xué)院,銀川 750004)
乳腺癌是女性最常見的惡性腫瘤,也是導(dǎo)致女性癌癥死亡的首要原因[1]。由于乳腺癌具有高度腫瘤異質(zhì)性,術(shù)前常規(guī)使用侵入性活檢技術(shù),并不能全面評估腫瘤異質(zhì)。磁共振成像(MRI)具有顯像清晰、多參數(shù)成像、軟組織分辨率高等優(yōu)點(diǎn),已成為臨床上較為先進(jìn)的乳腺影像學(xué)檢查方式,可非侵入性在術(shù)前分析腫瘤的整體特征。影像組學(xué)是一個(gè)新興的研究領(lǐng)域[2]。有研究[3]表明,影像組學(xué)在腫瘤良惡性的鑒別、化療反應(yīng)的預(yù)測、預(yù)后因素、分子亞型的預(yù)測等方面有重要前景。本研究旨在探討基于T2WI 和DCE-MRI 的影像組學(xué)特征預(yù)測浸潤性乳腺癌組織學(xué)分級(jí)的價(jià)值。
回顧性收集2017 年1 月至2021 年2 月在寧夏醫(yī)科大學(xué)總醫(yī)院放射科行乳腺M(fèi)RI 平掃+增強(qiáng)檢查,發(fā)現(xiàn)乳腺腫瘤性病變并有完整術(shù)后病理結(jié)果的病例。納入標(biāo)準(zhǔn):1)首次發(fā)現(xiàn)乳腺腫塊的患者,并經(jīng)術(shù)后病理證實(shí)為浸潤性乳腺癌;2)術(shù)前兩周內(nèi)進(jìn)行DCE-MRI 檢查;3)術(shù)前未接受侵入性穿刺活檢及放化療。排除標(biāo)準(zhǔn):1)圖像質(zhì)量較差,不能滿足后處理要求;2)臨床或病理資料不完整;3) 單側(cè)多發(fā)或雙側(cè)多發(fā)病變者。共納入132 例患者,全部為女性,年齡25~82 歲,中位年齡49 歲,腫瘤體積0.62~158.32 m3。Ⅰ級(jí)17 例、Ⅱ級(jí)69 例、Ⅲ級(jí)46 例。因Ⅰ級(jí)病例數(shù)較少,故將Ⅰ級(jí)+Ⅱ級(jí)合并為低級(jí)別組(86 例),Ⅲ級(jí)為高級(jí)別組(46 例)。
所有患者均采用美國GE Signa 1.5T 超導(dǎo)型磁共振機(jī)掃描,8 通道乳腺專用相控陣表面線圈。患者俯臥于檢查床,雙乳自然下垂,并使乳腺緊貼線圈,掃描范圍包括雙側(cè)乳腺及腋窩區(qū)。掃描序列有FSE T1WI 軸位、STIR T2WI 軸位、DWI、AXVibrant+C 動(dòng)態(tài)增強(qiáng)。成像參數(shù):TR=4 ms,TE=2 ms,TI=13 ms,層厚1 mm,翻轉(zhuǎn)角=14°,激勵(lì)次數(shù)=0.8,矩陣320×320,F(xiàn)OV=32 cm×32 cm。利用高壓注射器注射釓雙胺(Gd-DOTA-BMA),0.2 mmol·kg-1,流率為2.0 mL·s-1。對比劑注射前進(jìn)行蒙片掃描,注射完成后開始連續(xù)無間隔掃描7 個(gè)期相。
采用2003 年WHO 公布的諾丁漢(Nottingham) 分級(jí)系統(tǒng)作為浸潤性乳腺癌的標(biāo)準(zhǔn)組織學(xué)分級(jí)系統(tǒng)[4]。該系統(tǒng)基于細(xì)胞核的多形性、腺管形成的比例及核分裂計(jì)數(shù)3 項(xiàng)指標(biāo)進(jìn)行評估。每個(gè)指標(biāo)采用1~3 分記分系統(tǒng)進(jìn)行評估,再將3項(xiàng)指標(biāo)得分相加:3~5 分為Ⅰ級(jí),6~7 分為Ⅱ級(jí),8~9 分為Ⅲ級(jí)。
1.4.1 病灶分割 將脂肪抑制T2WI 及DCE-MRI(第3 期)圖像以DICOM 格式導(dǎo)入ITK-SNAP(version 3.8.0,www.itksnap.org) 軟件,在兩名具有5年工作經(jīng)驗(yàn)的放射科醫(yī)師在旁指導(dǎo)下手動(dòng)逐層勾畫腫瘤邊界,得到完整的腫瘤三維立體感興趣區(qū)ROI(無須避開腫瘤囊變、壞死、出血等病變區(qū)域),見圖1。
圖1 非特殊型浸潤性癌ITK-SNAP 圖像分析及影像組學(xué)特征提取
1.4.2 影像組學(xué)特征提取 將患者T2WI 及DCEMRI(第3 期)的原始圖像及ROI 文件一起導(dǎo)入AK 軟件,提取腫瘤ROI 的影像組學(xué)特征。包括腫瘤形態(tài)學(xué)特征、直方圖參數(shù)、紋理參數(shù)、灰度級(jí)游程長度矩陣(gray-level run length matrix,GLRLM)、灰度共生矩陣(gray-level cooccurrence matrix,GLCM)、灰度大小區(qū)域矩陣(gray-level size zone matrix,GLSZM)等396 個(gè)影像組學(xué)特征。
1.4.3 影像組學(xué)特征選擇 本研究樣本量132例,不分組,全部用于建模做自身驗(yàn)證。首先對數(shù)據(jù)預(yù)處理,包括:1)對所有數(shù)據(jù)中的缺失值用中位數(shù)替換。2)對特征進(jìn)行標(biāo)準(zhǔn)化處理(Z-score)。特征選擇包括:1)采用相關(guān)性分析,移除特征之間相關(guān)性>0.7 的特征。2)采用單因素邏輯回歸分析方法保留P<0.05 的特征。3)使用多因素邏輯回歸,結(jié)合逐步回歸篩選方法,保留0.01<P<0.05的特征子集。
1.4.4 模型建立及預(yù)測 分別采用Logistic 回歸、決策樹、RF 和支持向量機(jī)(SVM)4 種機(jī)器算法進(jìn)行建模,以克服低級(jí)別和高級(jí)別組間數(shù)據(jù)不平衡問題。以腫瘤組織學(xué)分級(jí)的結(jié)果(Ⅰ級(jí)+Ⅱ級(jí)vs Ⅲ級(jí))為二分類指標(biāo),獲取不同算法模型的受試者工作特征(ROC)曲線,采用ROC 來評估模型效能,效能評價(jià)指標(biāo)包括曲線下面積(AUC)、95%CI、靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值和陰性預(yù)測值。
采用R 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。應(yīng)用ROC 曲線評估模型預(yù)測浸潤性乳腺癌組織學(xué)分級(jí)的效能,繪制序列機(jī)器學(xué)習(xí)算法模型的ROC 曲線,通過計(jì)算AUC(95%CI)、靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值、陰性預(yù)測值來評估預(yù)測能力,AUC值>0.7,表明模型具有良好的診斷性能。采用Delong 檢驗(yàn)進(jìn)行機(jī)器算法模型AUC 值的比較,通過決策曲線(decision curve analysis,DCA)分析評估預(yù)測模型的臨床應(yīng)用價(jià)值。P≤0.05 為差異有統(tǒng)計(jì)學(xué)意義。
最終在396 個(gè)影像組學(xué)特征中于T2WI、DCE-MRI,以及T2WI/DCE-MRI 聯(lián)合序列分別篩選出3、2、3 個(gè)特征,見表1。
表1 不同序列提取的影像組學(xué)特征
基于T2WI、DCE-MRI、T2WI/DCE-MRI 聯(lián)合序列篩選的特征分別采用Logistic 回歸、SVM、決策樹和隨機(jī)森林(RF)4 種機(jī)器學(xué)習(xí)算法進(jìn)行建模,繪制序列機(jī)器學(xué)習(xí)算法模型的ROC 曲線,其中T2WI 和DCE 聯(lián)合序列中采用決策樹模型的診斷效能最佳,AUC 值為0.961,見圖2。通過ROC 曲線閾值分析確定各模型的AUC 值、靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值和陰性預(yù)測值,見表2,表3。利用Delong 檢驗(yàn)進(jìn)行機(jī)器學(xué)習(xí)算法模型AUC 值的比較,見表4,通過DCA 分析評估預(yù)測模型的臨床應(yīng)用價(jià)值,見圖3。
表2 不同序列機(jī)器學(xué)習(xí)算法模型預(yù)測的效能
表3 不同序列機(jī)器學(xué)習(xí)算法模型預(yù)測值
表4 各序列機(jī)器學(xué)習(xí)算法模型AUC 值的比較
圖2 基于T2WI、DCE-MRI、T2WI/DCE-MRI 的機(jī)器算法模型
圖3 T2WI、DCE 及T2WI/DCE 聯(lián)合序列機(jī)器算法模型DCA
乳腺癌的組織學(xué)分級(jí)是影響乳腺癌患者預(yù)后的主要因素之一,并且在術(shù)前進(jìn)行組織學(xué)分級(jí)對治療方案的選擇有指導(dǎo)作用。影像組學(xué)是通過高通量抽取影像中的量化特征,將其轉(zhuǎn)化為可挖掘的數(shù)據(jù),最終將這些數(shù)據(jù)的分析結(jié)果用于臨床診斷的決策支持[2]。影像組學(xué)的發(fā)展為無創(chuàng)預(yù)測乳腺癌組織分級(jí)提供了可能,近幾年,影像組學(xué)廣泛應(yīng)用于乳腺癌,主要集中在良惡性病變鑒別診斷、分子亞型分析、組織學(xué)分級(jí)鑒別、治療效果評估、轉(zhuǎn)移和預(yù)后預(yù)測[5-8]。本研究采用T2WI、DCE-T1WI 及二者聯(lián)合序列影像組學(xué)特征預(yù)測浸潤性乳腺癌組織學(xué)分級(jí),為患者在常規(guī)檢查后提供治療方案選擇和預(yù)后評估的額外價(jià)值。
本研究基于乳腺M(fèi)RI 圖像,分別在T2WI、DCE 及T2WI 和DCE 聯(lián)合序列圖像上提取影像組學(xué)特征,分別篩選出3、2 和3 個(gè)影像組學(xué)特征,采用Logistic 回歸、決策樹、RF 和SVM 4 種不同機(jī)器學(xué)習(xí)算法建立模型,預(yù)測浸潤性乳腺癌的組織學(xué)分級(jí)。其中T2WI 和DCE 聯(lián)合序列提取的2 個(gè)GLRLM 參數(shù)(短游程高灰度級(jí)強(qiáng)度、長游程高灰度級(jí)強(qiáng)度)和1 個(gè)直方圖參數(shù)(方差)采用決策樹模型預(yù)測效能最高,AUC 值為0.961(95%CI:0.931~0.985),靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值、陰性預(yù)測值分別為0.711、0.992、0.905、0.987、0.876。GLRLM 參數(shù)(短游程高灰度級(jí)強(qiáng)度、長游程高灰度級(jí)強(qiáng)度)反映了高灰度像素游程的不均勻性,其值越大,說明圖像越不均勻,病灶內(nèi)部結(jié)構(gòu)差異越大,腫瘤分化程度越低,組織學(xué)分級(jí)越高。直方圖參數(shù)(方差)反映圖像灰度的離散分布情況,其值越大,說明圖像的離散程度越高,分布越不均勻,病灶內(nèi)部結(jié)構(gòu)差異越大,腫瘤分化程度越低,組織學(xué)分級(jí)越高。這表明GLRLM 特征參數(shù)可以更好地表達(dá)腫瘤的異質(zhì)性,從而反映腫瘤的組織學(xué)分級(jí),這與吳佩琪等[9]的研究結(jié)果一致。
本研究結(jié)果顯示,基于乳腺M(fèi)RI 圖像T2WI、DCE 及T2WI 和DCE 聯(lián)合序列機(jī)器算法的模型對浸潤性乳腺癌組織學(xué)分級(jí)預(yù)測性能存在差異,T2WI 和DCE 聯(lián)合序列中,決策樹算法模型與Logistic、RF、SVM 算法模型的AUC 值之間差異具有統(tǒng)計(jì)學(xué)意義,與以往同類研究結(jié)果相似[10-12]。本研究中決策樹模型在T2WI、DCE 及T2WI 和DCE 聯(lián)合序列預(yù)測效能明顯高于Logistics 回歸、RF、SVM 模型,并且T2WI 和DCE 聯(lián)合序列采用決策樹模型預(yù)測浸潤性乳腺癌組織學(xué)分級(jí)診斷效能最佳,是預(yù)測浸潤性乳腺癌組織學(xué)分級(jí)的最佳模型,這與郭轉(zhuǎn)轉(zhuǎn)[13]的研究結(jié)果一致。Fan 等[14]的研究顯示,T2WI 和DCE-MRI 前、中、末增強(qiáng)圖像影像組學(xué)特征融合可預(yù)測浸潤性導(dǎo)管癌組織學(xué)分級(jí),表明解剖和功能磁共振圖像產(chǎn)生信息互補(bǔ),從而提高預(yù)測浸潤性乳腺癌組織學(xué)分級(jí)的性能。婁瀟方等[15]的研究表明,采用多參數(shù)磁共振影像組學(xué)可以提高預(yù)測乳腺癌病理信息的性能。本研究具有一定的局限性:ROI 分割為人工手段勾畫,對于邊界不清的腫瘤可能存在人為誤差,尤其T2WI 序列;本研究低級(jí)別和高級(jí)別樣本數(shù)據(jù)的不平衡可能會(huì)對結(jié)果產(chǎn)生一定的誤差;本組樣本量較少,再分組對所建模型進(jìn)行驗(yàn)證較為困難,以期收集更多病例進(jìn)行進(jìn)一步研究及驗(yàn)證。
綜上所述,基于乳腺T2WI 和DCE-MRI 圖像的影像組學(xué)模型可以無創(chuàng)預(yù)測浸潤性乳腺癌組織學(xué)分級(jí),且T2WI 和DCE-MRI 聯(lián)合序列采用決策樹機(jī)器算法模型預(yù)測性能最佳,可為臨床治療決策提供有價(jià)值的參考信息。