国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于影像特征建立乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移機(jī)器學(xué)習(xí)預(yù)測模型

2023-05-25 07:55吳澤琪馬夢偉劉仁懿曾鳳霞陳衛(wèi)國秦耿耿
關(guān)鍵詞:征象腫塊乳腺

吳澤琪,馬夢偉,劉仁懿,曾鳳霞,陳衛(wèi)國,秦耿耿

近年來乳腺癌的發(fā)病率呈快速上升趨勢,已超過肺癌成為全球第一大癌癥。早期發(fā)現(xiàn)并進(jìn)行有效的系統(tǒng)治療是降低乳腺癌死亡率的關(guān)鍵[1]。腋窩淋巴結(jié)(axillary lymph node, ALN)轉(zhuǎn)移情況是影響乳腺癌病人預(yù)后和治療決策的重要因素[2]。目前,ALN清掃和前哨淋巴結(jié)活檢是評(píng)估ALN 狀態(tài)的標(biāo)準(zhǔn)方法,但兩者均為有創(chuàng)性操作,可能導(dǎo)致上肢淋巴水腫、手臂外展受限等并發(fā)癥的發(fā)生[3]。影像學(xué)檢查作為一種無創(chuàng)性的手段,在乳腺癌的診斷及預(yù)后評(píng)估中發(fā)揮著重要作用。機(jī)器學(xué)習(xí)作為人工智能的重要分支,可以通過復(fù)雜的算法來分析大量數(shù)據(jù),識(shí)別數(shù)據(jù)中的模式并做出預(yù)測,在醫(yī)學(xué)領(lǐng)域應(yīng)用廣泛。然而,機(jī)器學(xué)習(xí)模型是一種“黑盒模型”,模型內(nèi)部機(jī)制難以理解,使得醫(yī)生未能充分信任其結(jié)果。SHAP(SHapley Additive exPlanation)可解釋技術(shù)能夠評(píng)估每個(gè)特征對(duì)模型輸出的貢獻(xiàn),可視化模型的決策過程。將醫(yī)生提取的影像學(xué)征象與可解釋機(jī)器學(xué)習(xí)算法相結(jié)合,有望構(gòu)建一個(gè)可重復(fù)性好且易理解的預(yù)測模型。既往ALN 轉(zhuǎn)移的相關(guān)研究大多僅納入單模態(tài)的影像數(shù)據(jù)進(jìn)行研究,而針對(duì)多模態(tài)影像征象對(duì)預(yù)測模型評(píng)價(jià)的研究尚少[2]。本研究旨在利用基于第5 版乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)[4]的乳腺癌原發(fā)灶全視野數(shù)字化乳腺X 線攝影(full-field digital mammography, FFDM)和超聲(US)征象構(gòu)建乳腺癌ALN 轉(zhuǎn)移預(yù)測模型,探索乳腺癌原發(fā)灶的FFDM 及超聲影像特征術(shù)前預(yù)測ALN 轉(zhuǎn)移的價(jià)值,以期尋找一種準(zhǔn)確、無創(chuàng)預(yù)測乳腺癌ALN 轉(zhuǎn)移的新方法。

1 資料與方法

1.1 一般資料 回顧性分析南方醫(yī)科大學(xué)南方醫(yī)院2012 年1 月—2018 年12 月經(jīng)病理證實(shí)為浸潤性乳腺癌320 例女性病人的臨床及影像資料,年齡28~77 歲,平均(49±11)歲。納入標(biāo)準(zhǔn):(1)術(shù)前1 個(gè)月內(nèi)行FFDM 和乳腺US 檢查;(2) 原發(fā)病灶在FFDM 和US 影像上均可見;(3)所有病人均經(jīng)病理明確了ALN 狀態(tài)。排除標(biāo)準(zhǔn):(1)行影像學(xué)檢查前接受過活檢或乳腺癌治療(包括新輔助化療、放射治療、內(nèi)分泌治療等);(2)影像學(xué)資料或臨床資料不完整;(3)影像質(zhì)量無法評(píng)估;(4)合并其他惡性腫瘤。根據(jù)ALN 病理結(jié)果是否有轉(zhuǎn)移灶,將病人分為ALN 陽性組(154 例)和陰性組(166 例)。陽性組年齡28~76 歲,中位年齡48(38,56)歲,ALN 陰性組病人年齡30~77 歲,中位年齡49(43,57)歲,2 組年齡差異無統(tǒng)計(jì)學(xué)意義(Z=-1.764,P=0.078)。

1.2 FFDM 檢查及影像分析 采用Siemens Mammomat Novation 及Hologic Selenia Dimensions 全數(shù)字化乳腺X 線機(jī)。掃描體位常規(guī)包括雙側(cè)內(nèi)外斜位和頭尾位,部分病例不能明確診斷時(shí),加拍局部加壓攝影或點(diǎn)壓放大攝影。由2 名具有10 年及以上乳腺影像診斷經(jīng)驗(yàn)的影像科醫(yī)師,在對(duì)ALN 病理結(jié)果不知情的情況下,根據(jù)第5 版BI-RADS 對(duì)乳腺癌病人的FFDM 影像進(jìn)行分析并提取征象,2 名醫(yī)師意見不一致則商討確定。共分析15 個(gè)征象,包括(1)乳腺腺體類型,分為脂肪類(a 型)、散在纖維腺體類(b 型)、不均勻致密類(c 型)、極度致密類(d型);(2)有無腫塊;(3)腫塊最大徑(cm);(4)腫塊密度,分為高密度、等密度、低密度或含脂肪密度;(5)腫塊形狀,分為圓形或卵圓形、不規(guī)則形;(6)腫塊邊緣,清晰/遮蔽、微分葉、毛刺、模糊;(7)可疑鈣化;(8)鈣化形態(tài),模糊不定形、粗糙不均質(zhì)、細(xì)小多形性、細(xì)線樣或細(xì)分枝狀鈣化;(9)鈣化分布,分為彌漫分布、區(qū)域性分布、成簇分布、線樣或段樣分布;(10)結(jié)構(gòu)扭曲;(11)非對(duì)稱致密;(12)乳頭回縮;(13)皮膚增厚;(14)皮膚回縮;(15)懸韌帶牽拉。

1.3 乳腺US 檢查及影像分析 采用Philips IU 22彩色多普勒超聲診斷儀,實(shí)時(shí)線陣高頻探頭,頻率為7.5~10 MHz。由2 名具有10 年及以上經(jīng)驗(yàn)的超聲診斷醫(yī)師,在對(duì)ALN 病理結(jié)果不知情的情況下,根據(jù)第五版BI-RADS 評(píng)估乳腺癌原發(fā)灶情況并提取征象,2 名醫(yī)師意見不一致則商討確定。共分析8個(gè)征象,包括(1)腫塊最大徑(cm);(2)腫塊形態(tài),圓形或卵圓形、不規(guī)則形;(3)腫塊邊緣,清晰、模糊、成角、微分葉、毛刺;(4)腫塊方向,不平行、平行;(5)病灶內(nèi)部回聲,回聲均勻、回聲不均勻;(6)病灶后方回聲,不變、增強(qiáng)、衰減;(7)強(qiáng)回聲光點(diǎn);(8)腫塊血供,無血供、內(nèi)部血供、外部血供。

1.4 預(yù)測模型構(gòu)建與驗(yàn)證 采用Python 3.7 進(jìn)行模型的構(gòu)建與驗(yàn)證,將數(shù)據(jù)集以8∶2 的比例隨機(jī)分為訓(xùn)練集(256 例)和測試集(64 例)。分別基于乳腺癌原發(fā)灶FFDM 征象、US 征象以及兩者聯(lián)合征象,采用隨機(jī)森林(random forest,RF)、極端梯度提升(extreme gradient boosting, XGBoost)、邏 輯 回 歸(logistics regression,LR)、支持向量機(jī)(support vector machine,SVM)算法構(gòu)建ALN 轉(zhuǎn)移預(yù)測模型。對(duì)數(shù)據(jù)集中的連續(xù)變量進(jìn)行最大最小值歸一化處理,采用最小絕對(duì)值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸算法篩選出與ALN 轉(zhuǎn)移相關(guān)的影像學(xué)征象,使用四折交叉驗(yàn)證調(diào)整模型參數(shù),防止模型過擬合。在測試集中評(píng)價(jià)模型效能,評(píng)估指標(biāo)包括準(zhǔn)確度、敏感度、特異度、陽性預(yù)測值(positive predict value,PPV)、陰性預(yù)測值(negative predict value, NPV)及受試者操作特征(receiver operating characteristic, ROC)曲線下面積(area under curve,AUC)。以AUC 作為主要的評(píng)價(jià)指標(biāo),選出效能最優(yōu)的FFDM 模型、US 模型以及聯(lián)合模型并比較3 種模型效能,選出最優(yōu)預(yù)測模型。采用SHAP 值評(píng)估每個(gè)特征對(duì)最優(yōu)模型輸出的貢獻(xiàn),以實(shí)現(xiàn)模型的可解釋性,分析乳腺癌ALN 轉(zhuǎn)移的影像預(yù)測因子。

1.5 統(tǒng)計(jì)學(xué)方法 采用SPSS 25.0 軟件對(duì)數(shù)據(jù)進(jìn)行分析。非正態(tài)分布的計(jì)量資料以中位數(shù)[M(P25,P75)]表示,2 組間比較采用Mann-Whitney U 檢驗(yàn)。計(jì)數(shù)資料以例(%)表示,2 組間比較采用卡方檢驗(yàn)或Fisher 確切概率檢驗(yàn)。采用Delong 檢驗(yàn)比較各模型的AUC。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1 2 組間FFDM 和超聲表現(xiàn)的比較 FFDM 上乳腺癌病灶表現(xiàn)為腫塊者282 例,可疑鈣化者149例。ALN 陽性組的腫塊最大徑大于陰性組(P<0.05),且更多見乳頭回縮和皮膚增厚(均P<0.05)。2組其余FFDM 征象的差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05),詳見表1。US 上,ALN 陽性組的腫塊最大徑也大于陰性組(P<0.05),強(qiáng)回聲光點(diǎn)的發(fā)生率高于ALN 陰性組(均P<0.05)。其余US 征象的差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05),詳見表2。

表1 2 組病人FFDM 表現(xiàn)比較 例(%)

表2 2 組病人US 表現(xiàn)比較 例(%)

2.2 模型預(yù)測效能評(píng)估 在測試集中,對(duì)基于3 種特征建立的不同機(jī)器學(xué)習(xí)模型的AUC 比較顯示,RF 分類器的診斷效能最優(yōu),如圖1 所示?;? 種特征構(gòu)建的RF 預(yù)測模型的AUC 比較顯示,與2 種單一特征模型相比,聯(lián)合特征模型的AUC 值較高(0.747),但3 種模型間AUC 值差異無統(tǒng)計(jì)學(xué)意義(均P>0.05);其中,F(xiàn)FDM 模型的特異度和陽性預(yù)測值最高,分別為0.893 和0.850。詳見表3、圖2。

圖1 測試集中基于3 種特征構(gòu)建的不同機(jī)器學(xué)習(xí)模型AUC比較

圖2 測試集中基于RF 分類器的3 種模型預(yù)測ALN 轉(zhuǎn)移的ROC 曲線

表3 基于RF 分類器的3 種模型對(duì)測試集乳腺癌ALN轉(zhuǎn)移的預(yù)測效能

2.3 特征重要性分析 使用SHAP 值評(píng)估每個(gè)特征對(duì)最優(yōu)聯(lián)合模型輸出的貢獻(xiàn),其中影響模型輸出最重要的5 個(gè)征象包括2 個(gè)US 征象(腫塊最大徑、強(qiáng)回聲光點(diǎn))和3 個(gè)FFDM 征象(皮膚增厚、乳頭回縮、乳腺密度散在纖維腺體類),且特征對(duì)模型輸出的影響依次減小(圖3)。其中,US 顯示腫塊越大、FFDM 上表現(xiàn)為皮膚增厚或乳頭回縮時(shí),模型預(yù)測更傾向于ALN 陽性;而在US 上未發(fā)現(xiàn)強(qiáng)回聲光點(diǎn)或在FFDM 上乳腺腺體類型表現(xiàn)為散在纖維腺體類時(shí),模型預(yù)測更傾向于ALN 陰性。圖4 列舉了模型對(duì)病例個(gè)體預(yù)測的決策過程。

圖3 最優(yōu)模型的特征SHAP 圖。橫軸表示SHAP 值,值為正數(shù)表示支持陽性預(yù)測,為負(fù)數(shù)則支持陰性預(yù)測;縱軸為模型納入的特征,并根據(jù)其對(duì)模型預(yù)測結(jié)果的影響,按重要性進(jìn)行降序排列;圖中每個(gè)點(diǎn)代表一個(gè)樣本,點(diǎn)的顏色表示特征的原始值,越接近紅色表示值越大,越接近藍(lán)色表示值越小。

圖4 病人女,31 歲,左乳浸潤性導(dǎo)管癌Ⅱ級(jí)伴左側(cè)ALN 轉(zhuǎn)移。左側(cè)FFDM 頭尾位(A 圖)及內(nèi)外斜位片(B 圖)示左側(cè)乳腺腺體類型為不均勻致密類,內(nèi)見高密度不規(guī)則形腫塊,邊緣模糊,皮膚未見增厚,乳頭無回縮。左側(cè)乳腺B 超影像(C圖)示不規(guī)則形實(shí)性低回聲團(tuán),邊緣部分呈“蟹足樣”改變,內(nèi)部回聲不均勻,其內(nèi)可見散在強(qiáng)回聲光點(diǎn)。左側(cè)乳腺彩色多普勒血流成像(CDFI)(D 圖)示病灶內(nèi)部及周邊可探及條狀彩色血流信號(hào)。E 圖為最優(yōu)模型預(yù)測的個(gè)體病例SHAP 特征貢獻(xiàn)分析圖,紅色條表示支持陽性預(yù)測,藍(lán)色條表示支持陰性預(yù)測,特征條的長度代表貢獻(xiàn)的大小,模型預(yù)測該病例ALN 轉(zhuǎn)移陽性的概率為0.62。

3 討論

近年來,多項(xiàng)研究[5-7]基于乳腺癌原發(fā)腫瘤的MRI、US、FFDM 影像組學(xué)特征構(gòu)建了ALN 轉(zhuǎn)移預(yù)測模型,其AUC 分別為0.780、0.710、0.740,與本研究構(gòu)建的最優(yōu)模型性能相似。然而,影像組學(xué)紋理分析過程受圖像采集和重建方法的影響,使得研究的可重復(fù)性及研究間的可比性減低[8]。同時(shí),組學(xué)特征可解釋性差,醫(yī)生難以理解,不能對(duì)其充分信任,從而限制其在臨床上的推廣。與之相比,由影像科醫(yī)生歸納總結(jié)的統(tǒng)一的影像特征(如BI-RADS)更具普適性,更易為醫(yī)生理解和接受。本研究采用不同算法構(gòu)建了基于BI-RADS 提取乳腺癌FFDM、US 及聯(lián)合2 種特征的ALN 轉(zhuǎn)移預(yù)測模型,基于RF算法構(gòu)建的3 種特征模型的AUC 均達(dá)到最高,分別為0.626、0.705、0.747,證實(shí)了結(jié)合原發(fā)腫瘤的FFDM 和US 征象所構(gòu)建的機(jī)器學(xué)習(xí)模型預(yù)測乳腺癌ALN 轉(zhuǎn)移具有一定的可行性。本研究構(gòu)建的FFDM 模型、US 模型及聯(lián)合模型的AUC 有遞增的趨勢,但3 種模型的診斷效能差異無統(tǒng)計(jì)意義,聯(lián)合模型的AUC 僅略高于單模態(tài)模型,這可能與樣本量較少有關(guān),后續(xù)將增加樣本量行進(jìn)一步研究。

SHAP 可解釋技術(shù)是一種基于博弈論最優(yōu)Shapley 值來解釋個(gè)體預(yù)測的方法,可直觀地顯示特征與模型輸出結(jié)果之間的關(guān)系,包括各特征對(duì)模型輸出的影響力的大小及正負(fù)性,適用于各類機(jī)器學(xué)習(xí)模型的可解釋性分析[9]。此外,SHAP 還能針對(duì)病例個(gè)體給出ALN 轉(zhuǎn)移預(yù)測概率,并可視化模型決策過程,評(píng)估每個(gè)特征對(duì)模型輸出的貢獻(xiàn),增加醫(yī)生對(duì)模型預(yù)測結(jié)果的信任。本研究中SHAP 對(duì)模型整體預(yù)測分析結(jié)果表明,在US 征象中,腫塊最大徑對(duì)模型輸出結(jié)果的影響最大,腫塊最大徑與ALN 轉(zhuǎn)移陽性呈正相關(guān),與既往文獻(xiàn)[10-11]報(bào)道的結(jié)果相符。此外,在US 上未發(fā)現(xiàn)強(qiáng)回聲光點(diǎn)時(shí),模型更傾向于預(yù)測ALN 轉(zhuǎn)移為陰性。Zong 等[12]研究也認(rèn)為US 影像上表現(xiàn)為腫塊微鈣化是乳腺癌ALN 轉(zhuǎn)移的獨(dú)立預(yù)測因子,與本研究一致。在FFDM 影像中,乳腺癌出現(xiàn)皮膚增厚或乳頭回縮時(shí),模型傾向于預(yù)測ALN 轉(zhuǎn)移為陽性。Dietzel 等[13]及牟等[14]對(duì)乳腺癌MRI 征象進(jìn)行研究,也得出了類似的結(jié)論。此外,當(dāng)乳腺腺體類型為散在纖維腺體類時(shí),模型更傾向于預(yù)測乳腺癌無ALN 轉(zhuǎn)移。既往研究[15-16]發(fā)現(xiàn),乳腺X 線密度與淋巴結(jié)轉(zhuǎn)移呈正相關(guān)。可能是由于致密型乳腺對(duì)病灶具有掩蓋效應(yīng),使得腫瘤在被發(fā)現(xiàn)之前已進(jìn)展至更具侵襲性的階段;此外,致密腺體與乳腺癌的發(fā)生發(fā)展之間可能存在潛在的生物學(xué)關(guān)系[17]。在本研究中,乳腺腺體類型對(duì)模型預(yù)測結(jié)果的影響相對(duì)較小,后續(xù)可擴(kuò)大樣本量研究。

本研究僅對(duì)乳腺癌原發(fā)灶的影像特征進(jìn)行研究,未納入ALN 征象。既往研究[18]表明,納入ALN特征可以進(jìn)一步提高模型的預(yù)測效能,但將會(huì)不可避免地在重要征象分析中占重要權(quán)重,從而影響病灶本身征象與ALN 轉(zhuǎn)移之間關(guān)系的分析[19]。在對(duì)ALN 轉(zhuǎn)移陽性的預(yù)測病例回顧時(shí)發(fā)現(xiàn),對(duì)于FFDM 及US 表現(xiàn)為ALN 陰性或ALN 征象難以評(píng)估的病例,本模型依舊能正確預(yù)測ALN 轉(zhuǎn)移陽性。本研究不依賴于ALN 影像征象,所構(gòu)建的聯(lián)合模型有望應(yīng)用于FFDM 及US 上ALN 表現(xiàn)為陰性或淋巴結(jié)征象難以評(píng)估的病例。后續(xù)將對(duì)ALN 征象進(jìn)一步研究。

本研究存在一些局限性:(1)FFDM 及US 檢查對(duì)乳腺癌的成像各有優(yōu)勢,互相補(bǔ)充,本研究是基于雙模態(tài)影像征象構(gòu)建的預(yù)測模型,模型效能較單模態(tài)模型有所提高,但實(shí)際工作中部分病例僅行一種影像檢查,后續(xù)將進(jìn)一步提高單模態(tài)模型效能以滿足臨床多方面需求;(2)本研究數(shù)據(jù)僅來自于單一醫(yī)療機(jī)構(gòu),缺少多中心數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。

綜上所述,基于FFDM 和US 征象的可解釋機(jī)器學(xué)習(xí)模型能較好地預(yù)測乳腺癌ALN 轉(zhuǎn)移,模型的可解釋性可直觀地展示ALN 轉(zhuǎn)移預(yù)測概率及模型決策過程,揭示ALN 轉(zhuǎn)移的影像預(yù)測因子,有望成為術(shù)前無創(chuàng)預(yù)測乳腺癌ALN 轉(zhuǎn)移的新手段。

猜你喜歡
征象腫塊乳腺
超聲造影在周圍型肺腫塊穿刺活檢中作用
產(chǎn)前超聲間接征象在部分型胼胝體發(fā)育不全診斷中的價(jià)值
乳房有腫塊、隱隱作痛,怎么辦
體檢查出乳腺增生或結(jié)節(jié),該怎么辦
得了乳腺增生,要怎么辦?
Ki-67、p53、CerbB-2表達(dá)與乳腺癌彩色超聲征象的關(guān)系
急性球形肺炎的CT征象分析
容易誤診的高回聲型乳腺病變
慢性腫塊型胰腺炎診斷和外科治療
針吸治療乳腺增生
淮阳县| 镇远县| 邯郸市| 连平县| 佳木斯市| 饶阳县| 青海省| 尉氏县| 宁夏| 社旗县| 女性| 黄梅县| 河西区| 黎川县| 青龙| 昌乐县| 汝城县| 莒南县| 常宁市| 东乡族自治县| 二连浩特市| 平罗县| 新化县| 博兴县| 七台河市| 磴口县| 旅游| 师宗县| 灵宝市| 买车| 临澧县| 阿克| 峡江县| 五台县| 柳江县| 新沂市| 普宁市| 雅江县| 蒙山县| 钟祥市| 东至县|