黃櫟有, 高先聰, 尤傳文
圖1 女,80歲,右乳乳頭狀癌。a)右側乳腺CC位X線圖像,顯示乳腺內橢圓形病灶,大部分邊界較清晰;b)手動勾畫ROI(紅色區(qū)域)后的圖像。 圖2 女,52歲,左乳纖維腺瘤。a)左側乳腺CC位X線圖像,顯示乳腺內不規(guī)則形病灶,部分邊界欠清晰;b)手動勾畫ROI(紅色區(qū)域)后的圖像。
乳腺癌作為發(fā)病率最高的女性惡性腫瘤,目前已成為我國45歲以下女性死亡率最高的惡性腫瘤之一[1]。盡早發(fā)現(xiàn)和診斷可以有效提高乳腺癌患者的生存率[2]。目前,乳腺X線檢查在良惡性乳腺腫塊的鑒別診斷中已得到廣泛的臨床應用,但僅憑對形態(tài)學特征的主觀分析來鑒別腫塊良惡性仍存在較大困難。紋理分析能夠提取并定量分析圖像中的紋理特征參數(shù),提供圖像中肉眼無法觀察到的潛在信息[3]。而機器學習作為一種人工智能算法,可以利用紋理分析提供的紋理特征參數(shù)建立疾病的分類模型。目前基于機器學習的紋理分析的相關研究已越來越多[4-6]。本研究擬探討基于乳腺X線圖像紋理特征所建立的機器學習模型在鑒別乳腺腫塊良惡性中的應用價值。
1.研究對象
回顧性搜集2017年1月-2019年12月在本院行乳腺X線檢查且經(jīng)病理證實的243例乳腺腫塊患者(263個病灶)的病例資料。所有患者為女性,年齡21~82歲,平均(50.4±15.41)歲。良性腫塊患者106例共腫塊124個,包括纖維腺瘤77例(95個腫塊)、乳腺病29例(29個腫塊);惡性腫塊患者137例共139個腫塊,包括浸潤性導管癌122例(124個腫塊)、導管內癌7例(7個腫塊)、乳頭狀癌4例(4個腫塊)、黏液腺癌4例(4個腫塊)。納入標準:①有明確的病理和臨床診斷結果;②腫塊內無明顯鈣化或空洞;③腫塊直徑0.5~3.0 cm。
2.檢查方法
使用HoLogic Inc. Lorad公司Selenia新型數(shù)字化乳腺X光機。常規(guī)攝取內外側斜位(mediolateral oblique,MLO)和頭尾位(cranial caudal,CC)X光片。選用Auto-Filter曝光模式,25~30 kV,75~95 mAs,圖像大小24 cm×29 cm。
3.建立機器學習模型
選擇圖像:由2位具有5年以上乳腺X線診斷經(jīng)驗的放射科醫(yī)師采用盲法對每例患者的MLO及CC圖像進行比較,選取腫塊顯示較清晰的圖像用于紋理分析。當兩位醫(yī)師的意見不同時,經(jīng)商議達成一致。將選定的圖像以bmp格式保存至電腦。
圖像分割及特征提?。翰捎肕aZda軟件對圖像進行后處理。為降低對比度和亮度對圖像灰度值可能帶來的影響,在軟件中選擇μ±3σ選項對每幀圖像進行灰度歸一化處理。由一位診斷醫(yī)師在每個腫塊灶內進勾畫ROI(圖1、2)。MaZda軟件提供6種紋理分析方法:①灰度直方圖;②灰度絕對梯度;③游程矩陣;④灰度共生矩陣;⑤自回歸模型;⑥小波變換。每個病灶共提取133個紋理特征,詳見表1。
圖3 RF模型中紋理特征重要性排序的線條圖。
表1 紋理特征列表
機器學習模型的建立及驗證:利用R語言(V3.5.1)的caret軟件包對數(shù)據(jù)進行處理和建模。首先,對提取到的紋理特參數(shù)進行初步降維,然后利用遞歸特征刪減法進行特征選擇,得到最終用于訓練模型的紋理特征參數(shù)。將處理后的所有數(shù)據(jù)分為訓練集和驗證集兩組,按照7﹕3的比例進行隨機分配。利用訓練集數(shù)據(jù)分別訓練獲得線性判別分析(linear discriminant analysis,LDA)、Logistic回歸(logistic regression,LR)、隨機森林(random forest,RF)和支持向量機(support vector machine,SVM)四種模型。其中LDA模型的k值為7時模型的精度最高,RF模型在決策樹為500、2叉樹變量樹為2時模型的精度最高。將訓練集獲得的4種模型分別在驗證集中進行驗證。
本研究分別通過符合率、Kappa系數(shù)以及ROC曲線下面積(area under the curve,AUC)對模型在訓練集和驗證集中的診斷效能進行評價,其中訓練集采用10折交叉驗證后所獲得的符合率、Kappa系數(shù)和AUC。通過Delong法比較驗證集中不同模型之間AUC的差異。以P<0.05為差異有統(tǒng)計學意義。
1.紋理特征的選擇結果
通過對133個紋理參數(shù)進行降維處理,篩選得到33個紋理特征。然后通過特征選擇,最終將22個紋理特征分別納入4個模型中進行建模,其中預測精度最高的5個自變量為梯度峰度、高高頻小波轉換系數(shù)S6、偏斜度、長游程補償和梯度偏斜度。
2.機器學習模型效能的評價
四種機器學習模型在訓練集和驗證集中的符合率、Kappa系數(shù)和AUC值見表2。訓練集中以RF模型的診斷效能最好,診斷符合率、Kappa系數(shù)和AUC值均高于其它3種模型;SVM模型的診斷效能次之。驗證集中以RF模型的符合率、Kappa系數(shù)和AUC值最高。
表2 機器學習模型ROC分析結果
通過Delong法比較4種模型間AUC的差異,結果見表3。RF模型與LDA、LR模型的AUC的差異有統(tǒng)計學意義(P<0.05),與SVM模型的AUC的差異無統(tǒng)計學意義(P>0.05)。其余各模型間AUC的差異無統(tǒng)計學意義(P>0.05)。RF模型中各項自變量的重要性排序見圖3,其中重要性排名前5的紋理特征為長游程補償、梯度峰度、偏斜度、高高頻小波轉換系數(shù)S6和峰度。
表3 四個模型間AUC的比較
乳腺X線攝影作為乳腺癌首選的檢查方法之一,對鈣化灶具有很強的分辨力。但對于軟組織結節(jié)和腫塊,其診斷能力有限。目前,已有研究結果顯示通過提取乳腺X線圖像的紋理特征建立預測模型,可以輔助并提高對乳腺病灶良惡性診斷的準確性[7-8]。但上述研究采用的模型算法并不統(tǒng)一,且未對不同建模算法的準確性進行對比分析。
本研究探討了乳腺X線圖紋理像特征建立機器學習模型在鑒別乳腺腫塊良惡性中的價值。研究發(fā)現(xiàn)4種預測模型的準確率均超過74%,AUC值均大于0.79,表現(xiàn)出良好的準確率和診斷效能。該結果與既往研究相符。在此基礎上本研究通過準確率、Kappa值以及AUC值分別對4種不同模型算法的表現(xiàn)進行比較。其中準確率是指樣本中正確分類的樣本數(shù)的百分比。Kappa值反映了分類精度的一致性。AUC值反應了模型的診斷效能。研究發(fā)現(xiàn)RF模型在訓練集與驗證集中準確率、Kappa值和AUC均高于其它模型。其中RF模型在驗證集中的準確率為94.8%,Kappa系數(shù)為0.896,AUC值為0.946。其與LDA模型、LR模型間AUC值差異具有統(tǒng)計學意義。RF模型在本研究中表現(xiàn)出高準確性、高度的分類一致性和顯著的診斷效能,提示RF模型在鑒別乳腺腫塊良惡性中最具潛力。RF模型作為一種用隨機方式建立的包含多個決策樹的分類器,具有可以處理高緯數(shù)據(jù)、模型泛化能力強、抗過擬合能力強以及魯棒性等優(yōu)點[9]。因此,RF模型可以基于圖像紋理特征參數(shù)訓練出較為穩(wěn)定的模型。
SVM模型的符合率和Kappa系數(shù)僅次于RF模型,驗證集中AUC值高于LDA和Logistic回歸模型,但差異不具有統(tǒng)計學意義。SVM模型通過尋找對空間劃分的最優(yōu)超平面,對特征空間進行分類。其具有不依賴數(shù)據(jù)維度、要求樣本量小和分類思想簡單等特點[10]。本研究中,LDA和Logistic回歸模型的表現(xiàn)要遜于RF和SVM模型。LDA模型本質是將初始樣本映射到維度更低的樣本空間中進行類別輸出。LDA模型對非高斯分布的樣本及在樣本分類信息依賴方差時表現(xiàn)較差,且容易出現(xiàn)過擬合。Logistic回歸模型作為被廣泛應用的一種廣義線性回歸模型,存在對連續(xù)變量異常值較敏感的問題,其預測結果嚴重依賴數(shù)據(jù)質量[4]。但相比屬于黑箱算法可解釋性差的RF和SVM模型,Logistic回歸模型的結果具有較強的可解釋性。因此,在疾病診斷中仍具有重要價值。近年來,利用機器學習模型預測疾病類型以及預后的研究越來越多。彭濤等[5]發(fā)現(xiàn)RF模型在多參數(shù)MRI診斷前列腺癌中表現(xiàn)最好,SVM模型次之;李琳等[11]研究發(fā)現(xiàn)RF與SVM模型對原發(fā)性肝癌的預后預測中優(yōu)于Logistic回歸模型。本研究結果與之相似。
RF模型支持對參數(shù)重要性的排序。結果顯示重要性排在前5位的紋理參數(shù)分別為長游程補償、梯度峰度、偏斜度、高高頻小波轉換系數(shù)S6以及峰度。游程矩陣反映了具有特定灰度值的像素在既定方向上出現(xiàn)的頻數(shù),長游程補償值越小表明圖像紋理越不均勻。峰度表示的是直方圖的銳度。偏斜度為直方圖的不對稱性的度量方法。高高頻小波轉換系數(shù)反應了圖像的細節(jié)及清晰度。以上紋理特征均被研究證明在對鑒別腫瘤的良惡性中存在價值[12-13]。
本研究的局限性:①本研究為回顧性單中心研究,且樣本量相對較少,研究結果可能存在一定偏倚;②ROI為人工勾畫,因此紋理特征的提取結果可能受到人為因素的影響;③本研究僅討論了4種模型算法,需對更多的模型算法做進一步的對比研究。
綜上所述,基于乳腺X線圖像紋理特征的機器學習模型在鑒別乳腺腫塊的良惡性中具有一定優(yōu)勢,其中RF模型表現(xiàn)出較好的分類性能,SVM模型的表現(xiàn)僅次于RF模型。