張玉姣, 宋德領(lǐng), 王燕飛, 馬永青, 楊飛, 朱月香, 崔書君
近年來,乳腺癌的發(fā)病年齡逐漸趨于年輕化,30歲以下的女性約有15%發(fā)生乳腺癌,其發(fā)病率在女性惡性腫瘤中排名第一。盡管全球乳腺癌患者的死亡率在下降,但是中國的死亡率卻在逐漸上升[1,2]。臨床研究表明[2],大多數(shù)局部晚期乳腺癌患者并非死于原發(fā)腫瘤,而是腫瘤轉(zhuǎn)移性疾病,而腋窩淋巴結(jié)(Axillary lymph node,ALN)陽性的乳腺癌患者的5年生存率為84%,低于ALN陰性患者的98%[3],因此,術(shù)前鑒別乳腺癌ALN狀態(tài)對于腫瘤的分期、治療和預后具有重要臨床意義。
在過去的幾年中,根治性乳腺切除術(shù)聯(lián)合ALN清掃術(shù)是乳腺癌的標準治療方法。有研究顯示超過70%的早期乳腺癌患者并沒有發(fā)生ALN轉(zhuǎn)移[4],在這種情況下,任何類型的腋窩部位手術(shù)都被認為是過度治療[5]。前哨淋巴結(jié)(Sentinel lymph node,SLN)活檢目前已經(jīng)代替ALN清掃術(shù)用于排除乳腺癌淋巴結(jié)轉(zhuǎn)移陰性患者和避免ALN清掃術(shù)后的并發(fā)癥的發(fā)生[5];但美國外科醫(yī)生腫瘤學會(American college of surgeons oncology group,ACOSOG)Z0011 研究表明[6],對于1或2個SLN轉(zhuǎn)移的乳腺癌患者,單行SLN活檢和行SLN活檢聯(lián)合ALN清掃術(shù)的總生存率相等,研究結(jié)果支持將具有1或2個SLN轉(zhuǎn)移患者納入到低風險組,這無疑導致了SLN活檢在腫瘤分期中的準確度下降;且SLN活檢是一種侵入性手術(shù),伴有明顯的并發(fā)癥,如上肢水腫、肩部功能障礙、局部神經(jīng)損傷和淋巴水腫等[7];另外,5%~10%的ALN假陰性率也不容忽視[8]。Gentilini等[9]開始質(zhì)疑SLN活檢在術(shù)前評估ALN狀態(tài)中的作用,提出在ALN陰性的低風險乳腺癌患者中應避免使用SLN活檢,該研究對于提高ALN陰型患者的生活質(zhì)量具有重要臨床意義。Bevilacqua等[4]發(fā)現(xiàn)乳腺癌患者的腫瘤類型、血管侵犯程度、雌激素受體和孕激素受體等臨床病理因素與ALN轉(zhuǎn)移具有顯著相關(guān)性,然而這些病理因素均是通過術(shù)中或病理活檢等有創(chuàng)性檢查獲得,對術(shù)前指導是否采取ALN清掃術(shù)意義不大。以上研究進一步說明了術(shù)前無創(chuàng)檢測ALN狀態(tài)方法的重要意義,需要為提高患者生活質(zhì)量提供一種更具有針對性的醫(yī)學途徑。本研究對乳腺X線圖像的影像組學特征進行分析,旨在探討其能否對乳腺癌患者的ALN狀態(tài)進行精準預測,在臨床中發(fā)揮相應作用。
1.病例資料
搜集2016年7月-2020年10月河北北方學院附屬第一醫(yī)院行乳腺X線攝影的原發(fā)性乳腺癌患者。病例納入標準:①經(jīng)病理證實為原發(fā)性乳腺癌;②接受淋巴結(jié)活檢;③術(shù)前一周內(nèi)接受乳腺X線攝影。病例排除標準:①既往有手術(shù)或接受過其他治療方案;②合并其他部位惡性腫瘤者;③圖像質(zhì)量不佳未能完成測量者。最終188例患者納入本研究,包括172例浸潤性導管癌,4例浸潤性小葉癌,2例乳頭狀癌。患者年齡38~73歲,平均(54.3±6.9)歲,依據(jù)ALN轉(zhuǎn)移結(jié)果按照7:3的比例將患者分為訓練組和驗證組,其中訓練組130例(轉(zhuǎn)移組患者58例,非轉(zhuǎn)移組72例),驗證組58例(轉(zhuǎn)移組27例,非轉(zhuǎn)移組31例)。
2.檢查方法
乳腺X線攝影檢查采用美國GE Healthcare乳腺X線成像(Senographe DS)系統(tǒng)進行圖像攝影,拍攝乳腺頭尾位(CC)和內(nèi)外側(cè)斜位(MLO)。攝影參數(shù):選擇Auto-time曝光模式,管電壓25~30 kV,管電流75~90 mAs,攝影距離40~50 cm,圖像大小25 cm×32 cm。由一位具有7年乳腺診斷經(jīng)驗的主治醫(yī)師測量記錄患者的腫瘤特征,包括腫瘤大小(最大直徑)、位置、形態(tài)、邊緣特征。
3.圖像分割和特征提取
將患者的CC位圖像以BMP格式從PACS系統(tǒng)內(nèi)導出,采用盲法原則將圖像導入開源MaZda分析軟件(The Technical University of Lodz,Institute of Electronics,http: //www.eletel.p.lodz.pl/mazda/)內(nèi),由兩位分別具有5年和7年乳腺診斷經(jīng)驗的主治醫(yī)師分別對腫瘤病灶區(qū)域進行勾畫,勾畫范圍盡量包括整個腫瘤區(qū)域(圖1、2),對于有爭議的區(qū)域參考MLO位圖像或MRI圖像進行商議后共同決定,每個ROI分別測兩次取平均值。
圖1 左側(cè)浸潤性導管癌患者,女,47歲。a)原始乳腺X線圖示左乳內(nèi)上象限高密度影(箭); b) 利用MaZda軟件勾畫ROI示意圖。 圖2 左側(cè)浸潤性導管癌患者,女,56歲。a) 原始乳腺X線圖示左乳內(nèi)下象限中等密度影(箭); b) 利用MaZda軟件勾畫ROI示意圖。
MaZda軟件生成共生成灰度直方圖(Histogram)、灰度共生矩陣(Gray-level cooccurrence matrix,GLCM)、游程長度矩陣(Grey level run length matrix,GLRLM)、絕對梯度(Absolute gradient)、自回歸模型(Autoregressive model parameters)和小波特征(Wavelet parameters)等317個影像組學特征,其中小波特征是基于Histogram、GLCM和GLRLM特征變換后的特征。
4.數(shù)據(jù)預處理、影像組學標簽的構(gòu)建與評估
5.統(tǒng)計學分析
采用R3.6.2統(tǒng)計分析軟件進行統(tǒng)計學分析。采用組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficients,ICC)評價兩位醫(yī)師測量 ROI參數(shù)的一致性,ICC為 0.75~1.00表示一致性較好。計量資料以均數(shù)(中位數(shù),四分位數(shù)間距)表示,計數(shù)資料以頻數(shù)表示。采用獨立樣本t檢驗比較兩組患者年齡和影像組學分數(shù)的差異,采用χ2檢驗比較兩組患者腫瘤大小、組織學分級、位置、雌激素受體、孕激素受體、形態(tài)、邊緣的差異。將具有統(tǒng)計學意義的指標進行單因素Logistic回歸分析,與影像組學分值構(gòu)建聯(lián)合預測模型并繪制影像組學列線圖,利用rms軟件包進行1000次重復抽樣后對列線圖的預測精準度進行標定并繪制校正曲線,采用ROC曲線對列線圖的診斷效能進行評價,運用devtools軟件包繪制臨床決策曲線圖,分析列線圖在不同閾值下的凈收益狀況以確定其臨床應用價值。以P<0.05 為差異有統(tǒng)計學意義。
1.兩組患者的一般資料及兩位醫(yī)師測量參數(shù)的一致性
訓練組和驗證組患者的臨床資料見表1,轉(zhuǎn)移組與非轉(zhuǎn)移組患者的影像組學分數(shù)、腫瘤大小差異具有統(tǒng)計學意義(P<0.05),其余指標差異均不具有統(tǒng)計學意義(P>0.05)。
表1 訓練組和驗證組患者的一般臨床資料比較 (例)
兩位醫(yī)師在乳腺X線圖像內(nèi)提取的影像組學特征參數(shù)一致性較高,ICC值為0.767~0.916。
2.預測模型的建立與驗證
兩位醫(yī)師從Mazda軟件中共提取出317個影像組學特征,使用方差分析法進行初篩后剩余258個參數(shù),然后利用LASSO算法進行進一步篩選,最終在λ=0.0356處篩選出14個特征構(gòu)建影像組學標簽(圖3、表2),結(jié)果顯示訓練組和驗證組標簽的AUC分別為0.760和0.742(表3)。
圖3 LASSO算法篩選影像組學特征。a) LASSO回歸的特征選擇,通過調(diào)節(jié)不同的超參數(shù)(λ)使得模型的二項式偏差達到最小,從而達到篩選最優(yōu)特征的目的。左側(cè)垂直虛線表示取最佳λ值時log(λ)對應的最小偏差值,對應的log(λ)= -2.998,右側(cè)虛線代表最佳λ值所對應的函數(shù)值,圖片頂端的為納入的特征數(shù);b)使用10倍交叉驗證法篩選特征的特征系數(shù)收斂圖,在圖中垂直線對應篩選出具有非零系數(shù)的特征,共選出14個最佳特征。 圖4 預測乳腺癌ALN轉(zhuǎn)移的影像組學列線圖,在影像組學分值、腫瘤大小的坐標軸進行定位,繪制垂直于第一條分值的直線,計算各條直線所對應的分值總和,在總分值坐標軸進行定位,繪制垂直于ALN轉(zhuǎn)移概率橫軸的直線,所對應的概率即為乳腺癌患者發(fā)生ALN轉(zhuǎn)移的概率。
表2 基于LASSO算法進行特征篩選后選取的最佳特征參數(shù)及系數(shù)
為了給臨床提供一個方便快捷的預測工具,將影像組學特征聯(lián)合腫瘤大小建立聯(lián)合預測模型,并繪制列線圖使模型可視化(圖4),訓練組和驗證組的校正曲線顯示聯(lián)合預測模型的預測值與真實值的一致性良好(圖5a、b),具有較好的校準性能。列線圖在訓練組模型中的AUC為0.808,敏感度和特異度分別為93.10%和58.33%;驗證組模型的AUC為0.811,敏感度和特異度分別為81.48%和70.97%(表3,圖6a、b)。使用臨床決策曲線對列線圖進行評估(圖7),結(jié)果顯示在閾值為5%~82%時,使用影像組學列線圖預測乳腺癌ALN轉(zhuǎn)移的臨床凈收益較大。
表3 影像組學標簽和聯(lián)合預測模型的診斷效能
圖5 聯(lián)合預測模型預測ALN轉(zhuǎn)移的校正曲線,描述列線圖在經(jīng)過1000次重復抽樣后預測ALN轉(zhuǎn)移的概率和ALN轉(zhuǎn)移實際發(fā)生概率的一致性,45°虛線表示理想預測性能,另外兩條虛線和實線分別表示列線圖的預測性能和列線圖偏差的修正,預測性能虛線越接近45°理想性能虛線,表示模型的預測準確度越高。a)訓練組;b)驗證組。 圖6 聯(lián)合預測模型預測乳腺癌ALN轉(zhuǎn)移的ROC曲線。a)訓練組; b)驗證組。 圖7 影像組學列線圖的決策曲線分析。x軸表示閾值概率,y軸表示凈收益,灰線代表所有患者均發(fā)生ALN轉(zhuǎn)移,黑線代表沒有ALN轉(zhuǎn)移的假設(shè),藍線代表影像組學列線圖。決策曲線顯示,當閾值概率為5%~82%時,影像組學的凈收益高于其余兩種情況。
近年來,無創(chuàng)性的影像學檢查手段已廣泛應用于乳腺癌的篩查和診斷。有研究顯示乳腺X線、CT、MRI診斷乳腺癌ALN轉(zhuǎn)移的敏感度和特異度分別為14.0%、93.0%、95.3%和84.8%、57.6%、65.2%[10],乳腺X線過低的敏感度和CT、MRI過低的特異度均難以在術(shù)前對乳腺癌患者的ALN狀態(tài)進行精確評估。盡管超聲引導的淋巴結(jié)細針穿刺可以提高術(shù)前ALN轉(zhuǎn)移的診斷符合率,但在沒有明顯腫瘤侵襲的證據(jù)下,仍需進一步手術(shù)進行腫瘤分期。Caudle等[11]研究顯示利用動態(tài)對比增強磁共振成像(dynamic contrast enhancement magnetic resonance imaging,DCE-MRI)圖像內(nèi)腫瘤和淋巴結(jié)的特征如腫瘤大小、邊緣光滑程度、淋巴結(jié)的皮質(zhì)厚度、脂肪門狀態(tài)對ALN轉(zhuǎn)移進行預測,但肉眼對影像上病灶組織細微結(jié)構(gòu)的分辨率有限,很多具有較高診斷價值的圖像特征不能被肉眼所捕捉。因此,鑒于傳統(tǒng)檢查方法的局限性,開發(fā)一種高度特異性、無創(chuàng)、安全的ALN狀態(tài)檢測方法一直是一個挑戰(zhàn)。
目前乳腺癌影像組學發(fā)展迅速,已廣泛應用于鑒別乳腺腫瘤良惡性、判定乳腺癌分子分型、評估新輔助化療療效等方面[12-14],但是關(guān)于乳腺癌ALN狀態(tài)的研究較少,Yu等[15]利用426例早期乳腺癌的超聲圖像進行影像組學分析,利用LASSO算法篩選出14個影像組學特征作為最佳特征構(gòu)建影像組學標簽,訓練組和驗證組標簽的AUC分別為0.78和0.71。Han等[16]利用411例乳腺癌DCE-MRI圖像進行分析,篩選出12個影像組學特征建立標簽對乳腺癌ALN轉(zhuǎn)移進行預測,研究結(jié)果顯示訓練組和驗證組標簽的AUC分別達到了0.76和0.78。聶悅等[17]回顧性分析了402例乳腺癌患者的增強CT圖像,篩選出10個最優(yōu)影像組學特征建立模型預測腋窩淋巴結(jié)轉(zhuǎn)移,結(jié)果顯示測試組的AUC、敏感度和特異度分別為0.92、82%、92%。本研究利用LASSO算法對乳腺X線圖像內(nèi)提取了317個組學特征進行篩選,最終14個最優(yōu)特征被納入到影像組學標簽中用于對乳腺癌ALN狀態(tài)進行評估,特征類型包括Histogram、CLCM、GLRLM和小波特征。訓練組影像學標簽的AUC為0.760和0.742,達到了中等預測性能。Yang等[18]通過114例乳腺癌患者的乳腺X線圖像進行影像組學分析,采用支持向量機模型對ALN轉(zhuǎn)移患者進行分類,研究結(jié)果顯示訓練組和驗證組模型的AUC分別為0.89和0.87,高于本研究影像組學標簽的預測性能,可能與模型類型、特征的提取和篩選方式有關(guān)。CLCM、GLRLM特征是影像組學和機器學習領(lǐng)域內(nèi)應用較為廣泛的特征參數(shù),本研究中有10個紋理參數(shù)納入標簽中,與Tan等[19]從T2脂肪抑制序列中篩選出的與乳腺癌ALN轉(zhuǎn)移相關(guān)的17個紋理參數(shù)一致,表明該類參數(shù)在反映腫瘤內(nèi)細胞分子間的相互作用所引起圖像紋理空間結(jié)構(gòu)分布的改變中具有重要貢獻,并且可以根據(jù)影像組學標簽計算出的分值對腫瘤的生物學行為進行解釋。
本研究對一些可在術(shù)前獲得的臨床因素如患者年齡、腫瘤大小、邊界、光滑程度進行了研究,ALN轉(zhuǎn)移患者的腫瘤大小顯著高于未轉(zhuǎn)移患者,與先前研究一致,腫瘤大小與同側(cè)腋窩淋巴結(jié)轉(zhuǎn)移有著密切關(guān)系[20,21],可以作為預測因子在術(shù)前對乳腺癌ALN狀態(tài)進行評估,為患者手術(shù)方案的制定提供可靠參考信息。本研究對患者臨床指標進行了統(tǒng)計分析,將單因素Logistic分析中具有統(tǒng)計學差異的腫瘤大小聯(lián)合影像組學標簽建立聯(lián)合預測模型,并繪制列線圖使模型可視化,ROC曲線顯示訓練組和驗證組聯(lián)合預測的AUC分別為0.808和0.811,均高于影像組學標簽的預測效能,一方面提示列線圖對乳腺癌ALN轉(zhuǎn)移的預測能力優(yōu)于單一的影像組學標簽,腫瘤大小和鈣化特征在提高模型的預測性能中有著重要作用;另一方面則反映了列線圖有著較好的泛化能力,未出現(xiàn)數(shù)據(jù)過擬合現(xiàn)象,可以較精確地對發(fā)生乳腺癌ALN轉(zhuǎn)移與非ALN轉(zhuǎn)移患者進行鑒別。本研究所采用的列線圖更適合應用于臨床,不僅可以從乳腺X線圖像內(nèi)獲取影像組學分值為治療決策的制定提供數(shù)據(jù)支持,還可聯(lián)合腫瘤大小指標對ALN轉(zhuǎn)移患者進行預測。因此筆者認為影像組學列線圖可作為預測乳腺癌ALN轉(zhuǎn)移的可靠工具,為改善患者生活質(zhì)量提供一種新的醫(yī)學途徑。
本研究存在以下局限性:①本研究應納入部分已被證實與乳腺癌ALN轉(zhuǎn)移相關(guān)的臨床、病理因素(如腫瘤類型、血管侵犯程度等),可進一步提升模型的總體準確率;②本研究基于LASSO算法對特征進行降維,可能會篩選掉一些具有潛在鑒別價值的特征參數(shù),導致最終模型的準確度受到一定程度影響;③本研究基于二維乳腺X線圖像進行影像組學分析,DCE-MRI在顯示乳腺內(nèi)部解剖形態(tài)和瘤體血流動力學方面優(yōu)于乳腺X線和超聲,且可融合為三維圖像進行圖像分析,可在未來的研究中進一步探討;④本研究的樣本均來自于同一家醫(yī)院且樣本數(shù)量較少,需要在未來加入多中心的數(shù)據(jù)集對模型進行外部驗證。
綜上所述,基于乳腺X線圖像提取的影像組學特征可作為預測乳腺癌ALN轉(zhuǎn)移的潛在生物標志物,聯(lián)合臨床因素構(gòu)建的列線圖可快速對ALN轉(zhuǎn)移患者進行預測,為臨床決策制定和預后判斷提供更可靠的參考信息。