国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于超聲和臨床特征決策樹模型預(yù)測(cè)乳腺癌分子亞型

2022-07-13 01:24游小慧顧華蕓董智芬郭建鋒
腫瘤影像學(xué) 2022年3期
關(guān)鍵詞:亞型決策樹B型

施 維,夏 威,黃 敏,常 才,王 宇,游小慧,顧華蕓,董智芬,郭建鋒

1. 中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所醫(yī)學(xué)影像技術(shù)研究室,江蘇 蘇州215163;

2.南京醫(yī)科大學(xué)附屬蘇州醫(yī)院,蘇州市立醫(yī)院超聲科,江蘇 蘇州215001;

3. 復(fù)旦大學(xué)附屬腫瘤醫(yī)院超聲科,上海200032

最新統(tǒng)計(jì)數(shù)據(jù)顯示,乳腺癌發(fā)病數(shù)高居世界第一,是全球第五大癌癥致死原因;在中國,乳腺癌發(fā)病數(shù)在所有癌癥中位列第四[1]。乳腺癌是一類具有高度異質(zhì)性的腫瘤,不同分子亞型乳腺癌的生物學(xué)行為、臨床治療效果和患者預(yù)后有明顯差異。分子亞型是臨床制訂乳腺癌診療方案及評(píng)估患者預(yù)后的重要依據(jù),早期預(yù)測(cè)尤其是術(shù)前預(yù)測(cè)乳腺癌分子亞型對(duì)指導(dǎo)臨床治療及改善預(yù)后至關(guān)重要[2]。St. Gallen國際乳腺癌會(huì)議根據(jù)免疫組織化學(xué)指標(biāo)雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)、腫瘤細(xì)胞Ki-67增殖指數(shù)以及熒光原位雜交(fluorescence in situ hybridization,F(xiàn)ISH)檢測(cè)結(jié)果,將乳腺癌分為管腔A(Luminal A,LA)型、管腔B(Luminal B,LB)型、HER2過表達(dá)(HER2 over-expression,HER2+)型和三陰性乳腺癌(triple-negative breast cancer,TNBC)型[3]。但是,病理學(xué)診斷存在滯后、取樣誤差等問題。

超聲因其安全和便捷的特點(diǎn),已經(jīng)成為乳腺癌診治過程中重要的影像學(xué)檢查方法。已有研究[4-5]表明,乳腺癌超聲聲像圖與分子分型之間存在相關(guān)性,這些研究僅初步分析兩者的相關(guān)性,如何建立切實(shí)可行的乳腺癌分子亞型預(yù)測(cè)模型仍是目前研究的難點(diǎn)。決策樹是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中常用的多特征分類技術(shù)之一,能綜合分析特征之間復(fù)雜的關(guān)系,結(jié)果容易解釋,而且穩(wěn)健性強(qiáng)[6]。本研究基于超聲聲像圖和臨床特征,運(yùn)用機(jī)器學(xué)習(xí)中的決策樹算法,建立乳腺癌分子亞型預(yù)測(cè)模型,以期為乳腺癌個(gè)體化治療提供更有價(jià)值的信息。

1 資料和方法

1.1 一般資料

回顧并分析2017年12月—2019年12月共547例患者的臨床信息、病理學(xué)指標(biāo)和超聲聲學(xué)特征等資料。納入標(biāo)準(zhǔn):① 病理學(xué)檢查確診為浸潤性乳腺癌;② 有免疫組織化學(xué)和FISH檢測(cè)結(jié)果;③ 有完整的超聲檢查記錄;④ 有乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BI-RADS)評(píng)分;⑤ 檢查后2周內(nèi)行手術(shù)或活檢。排除標(biāo)準(zhǔn):① 免疫組織化學(xué)或FISH檢查結(jié)果缺失;② 2周后行手術(shù)或活檢;③病理學(xué)類型為原位癌;④ 接受新輔助化療。最終入組420例患者,其中LA型137例,LB型157例,HER2+型61例,TNBC型65例。

1.2 儀器與方法

采用德國Siemens公司的Acuson S2000、美國GE公司的Logiq E9、荷蘭Philips公司的iU Elite、意大利Esaote公司的MyLab Twice、深圳邁瑞生物醫(yī)療電子股份有限公司(邁瑞)的Resona 7超聲診斷儀,使用頻率>7.5 MHz的高頻線陣探頭。采集包括病灶最大徑切面和相應(yīng)正交切面的灰階、彩色多普勒血流成像,以及有代表性的惡性圖像、腋窩淋巴結(jié)圖像。由2名高年資(>8年)超聲科醫(yī)師回顧并分析患者的超聲影像學(xué)資料,記錄各分子亞型的基礎(chǔ)臨床特征和超聲影像學(xué)特征,意見不同時(shí),經(jīng)討論后達(dá)成一致。

超聲聲學(xué)特征分析參照2013年版BI-RADS,包括形態(tài)、方位、邊緣、內(nèi)部回聲、后方回聲改變、鈣化形態(tài)和部位、繼發(fā)改變(導(dǎo)管、皮下水腫);血流豐富程度評(píng)估采用Adler分級(jí)(2、3級(jí)為豐富,0、1級(jí)為不豐富)[7]。

根據(jù)Ecanow等[8]方法評(píng)價(jià)腋窩淋巴結(jié),并分為有轉(zhuǎn)移和無轉(zhuǎn)移。

借助Scikit-learn 0.22.2[9]工具構(gòu)建4個(gè)決策樹,并對(duì)乳腺癌分子亞型進(jìn)行預(yù)測(cè)。4種分子亞型之間差異有統(tǒng)計(jì)學(xué)意義的臨床和超聲特征被納入決策樹建模分析,利用基尼系數(shù)對(duì)決策樹的特征進(jìn)行篩選和排序,決策樹的最優(yōu)參數(shù)通過對(duì)訓(xùn)練集進(jìn)行5折交叉驗(yàn)證獲得。使用曲線下面積(area under curve,AUC)作為模型預(yù)測(cè)效果的評(píng)估指標(biāo)。

分別計(jì)算決策樹模型與高年資超聲科醫(yī)師讀片預(yù)測(cè)分子亞型的靈敏度,比較兩者診斷的差異。超聲科醫(yī)師鑒別分子亞型的標(biāo)準(zhǔn)如下:LA型或LB型(形態(tài)不規(guī)則,毛刺,成角,后方回聲衰減)、HER2+型(鈣化,血流信號(hào)豐富,后方回聲無衰減)、TNBC型(形態(tài)不規(guī)則,無毛刺成角,直徑>30 mm,后方回聲無衰減)。

1.3 統(tǒng)計(jì)學(xué)處理

采用R語言分析軟件R Studio 4.0.3分析數(shù)據(jù)的統(tǒng)計(jì)學(xué)指標(biāo)。計(jì)量資料使用方差分析檢驗(yàn),計(jì)數(shù)資料分析用Fisher精確概率檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。選取來源于Philips和邁瑞的287例數(shù)據(jù)作為訓(xùn)練集,來源于Siemens、GE和Esaote的共133例數(shù)據(jù)作為測(cè)試集(表1)。

表1 不同超聲診斷儀的患者分布情況

2 結(jié) 果

2.1 不同分子亞型超聲特征和臨床特征分析

根據(jù)BI-RADS評(píng)價(jià)方法分析超聲特征,結(jié)合臨床信息共計(jì)15項(xiàng)特征(表2)。腫瘤最大徑、腫瘤內(nèi)部回聲變化、腫瘤后方回聲變化、鈣化形態(tài)、有無轉(zhuǎn)移性淋巴結(jié)、臨床分期、鈣化部位7種特征差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。將這7種特征納入決策樹模型建模,特征賦值說明見表3,共建立4個(gè)決策樹,8條決策規(guī)則。

表2 超聲特征和臨床特征分布情況

表3 超聲特征及臨床特征賦值

續(xù)表

2.2 LA型決策樹

LA型決策樹模型如圖1所示,首先根據(jù)腫瘤最大徑是否超過17.5 mm分為兩條路徑。路徑1:最大徑≤17.5 mm且腫瘤后方回聲衰減,則預(yù)測(cè)為LA型,該路徑正確判定7例患者,1例錯(cuò)誤。路徑2:最大徑>20.5 mm且無淋巴結(jié)轉(zhuǎn)移,則預(yù)測(cè)為LA型該路徑正確判定37例患者,25例錯(cuò)誤。不符合上述2條路徑的歸入非LA型。決策樹模型在訓(xùn)練集和測(cè)試集上的受試者工作特征(receiver operating characteristic,ROC)曲線如圖2所示,模型在訓(xùn)練集和測(cè)試集上的AUC值分別為0.731和0.706。

圖1 決策樹模型預(yù)測(cè)LA型的分類路徑及示例

2.3 LB型決策樹

LB型決策樹模型如圖3所示。路徑1:如果患者腫瘤無鈣化且腫瘤最大徑大于10.5 mm,則預(yù)測(cè)為LB型,該路徑正確判定9例患者,5例錯(cuò)誤。路徑2:如果患者腫瘤有微鈣化或粗鈣化且無淋巴結(jié)轉(zhuǎn)移,同時(shí)患者的腫瘤最大徑>24.5 mm,則預(yù)測(cè)為LB型,該路徑正確判定17例患者,7例錯(cuò)誤。路徑3:如果患者腫瘤有微鈣化或粗鈣化且有淋巴結(jié)轉(zhuǎn)移,同時(shí)患者的腫瘤最大徑≤21.0 mm,則預(yù)測(cè)為LB型,該路徑正確判定14例患者,2例錯(cuò)誤。決策樹模型在訓(xùn)練集和測(cè)試集上的ROC曲線如圖2 各分子亞型決策樹模型在訓(xùn)練集和測(cè)試集上的ROC曲線所示。不符合以上3條路徑的歸入非LB型。模型在訓(xùn)練集上和測(cè)試集的AUC分別為0.708和0.626。

圖2 各分子亞型決策樹模型在訓(xùn)練集和測(cè)試集上的ROC曲線

圖3 決策樹模型預(yù)測(cè)LB型的分類路徑及示例

2.4 HER2+型決策樹

HER2+型決策樹模型如圖4所示。首先根據(jù)病灶后方回聲變化分為兩條路徑,如果患者腫瘤后方回聲為無變化或衰減且腫瘤最大徑>20.5 mm,同時(shí)患者的腫瘤為微鈣化或粗鈣化,則預(yù)測(cè)為HER2+型。該路徑正確判定21例患者,8例錯(cuò)誤。不符合該路徑的歸入非HER2+型。決策樹模型在訓(xùn)練集和測(cè)試集上的ROC曲線如圖2所示,模型在訓(xùn)練集和測(cè)試集上的AUC分別為0.722和0.784。

圖4 決策樹模型預(yù)測(cè)HER2+型的分類路徑及示例

2.5 TNBC型決策樹

TNBC型模型如圖5A所示,根據(jù)病灶后方回聲是否增強(qiáng)分為兩條路徑。路徑1:如果患者腫瘤后方回聲增強(qiáng)且腫瘤粗鈣化或無鈣化,則預(yù)測(cè)為TNBC型。該路徑正確判定12例患者,0例錯(cuò)誤。路徑2:如果患者腫瘤后方回聲衰減或無變化且最大徑>30.5 mm,同時(shí)患者有淋巴結(jié)轉(zhuǎn)移,則預(yù)測(cè)為TNBC型。該路徑正確判定8例患者,1例錯(cuò)誤。不符合兩條路徑的歸入非TNBC型。決策樹模型在訓(xùn)練集和測(cè)試集上的ROC曲線如圖2所示,模型在訓(xùn)練集和測(cè)試集上的AUC分別為0.877和0.762。

圖5 決策樹模型預(yù)測(cè)TNBC型的分類路徑及示例

2.6 對(duì)比決策樹模型與超聲科醫(yī)師鑒別分子亞型

由于超聲科醫(yī)師難以從超聲圖像上區(qū)分LA型和LB型,本研究將測(cè)試集中的LA型和LB型合并為Luminal型,對(duì)比了決策樹模型與超聲科醫(yī)師在合并測(cè)試集上鑒別分子亞型的靈敏度(表4)。結(jié)果顯示,決策樹模型鑒別Luminal、HER2+和TNBC型的靈敏度均高于超聲科醫(yī)師。在鑒別TNBC型中,決策樹模型的靈敏度較高(81.0%)。

表4 在合并測(cè)試集上對(duì)比決策樹模型與超聲科醫(yī)師鑒別分子亞型的靈敏度

3 討 論

免疫組織化學(xué)以及FISH檢測(cè)是判斷乳腺癌分子亞型的主要方法,但也有一定限制性:① 由于設(shè)備、費(fèi)用和醫(yī)師原因,部分醫(yī)院不具備檢測(cè)能力;② 病理學(xué)檢查結(jié)果的獲取是有創(chuàng)的而且具有滯后性(1~2周);③ 乳腺癌的空間異質(zhì)性導(dǎo)致活檢取樣誤差[10]。決策樹模型作為預(yù)測(cè)乳腺癌分子亞型的新方法,有望在一定程度上彌補(bǔ)病理學(xué)檢查的不足,為乳腺癌的個(gè)體化治療提供更加全面的信息。

雖然基于超聲圖像分析乳腺癌分子亞型是一個(gè)相對(duì)較新的領(lǐng)域,但已有證據(jù)支持超聲表現(xiàn)和腫瘤生物學(xué)之間的關(guān)系。有研究[4,11]表明,不同分子亞型的乳腺癌灰階超聲聲像圖存在一定的差異:HER2+容易出現(xiàn)微小鈣化,TNBC后方回聲增強(qiáng),LA型多見毛刺、后方回聲衰減等。有研究[12-13]發(fā)現(xiàn),不同分子亞類型之間的剪切波速度值存在顯著差異,也有學(xué)者根據(jù)彩色多普勒血流成像分析不同亞型血管的分布情況。針對(duì)定量指標(biāo),這些研究一般采用單因素方差分析,比較年齡、腫瘤大小、Ki-67增殖指數(shù)等在不同亞型之間的差異;定性指標(biāo)采用χ2檢驗(yàn),比較淋巴結(jié)轉(zhuǎn)移、形態(tài)、鈣化、邊緣、內(nèi)部回聲、后方回聲等在不同亞型之間的差異。這些評(píng)價(jià)方法相對(duì)較為簡(jiǎn)單,未將定量和定性指標(biāo)綜合分析,不足以據(jù)此進(jìn)行亞型的預(yù)測(cè)。我們采用決策樹模型,綜合定性和定量指標(biāo),整合臨床和超聲聲像圖特征,探索了乳腺癌不同亞型臨床和超聲特征的組合方式,為乳腺癌分子亞型預(yù)測(cè)提供一種實(shí)用的決策樹。

本研究發(fā)現(xiàn),腫瘤血流信號(hào)Adler分級(jí)、患者年齡、伴發(fā)導(dǎo)管改變、是否平行位生長在亞型之間差異無統(tǒng)計(jì)學(xué)意義,與郭玉萍等[4]的研究結(jié)果類似。有研究[12-14]發(fā)現(xiàn),LA型與LB型的聲像圖差異較小,鑒別有一定的困難。本研究發(fā)現(xiàn)LA和LB型具有惡性腫瘤常見特點(diǎn):形態(tài)不規(guī)則、邊界模糊、后方回聲衰減;這與病理學(xué)研究結(jié)果一致:組織學(xué)分級(jí)低的乳腺癌生長緩慢(如LA型)、容易伴有細(xì)胞外基質(zhì)變化、膠原沉著或重組;超聲往往表現(xiàn)為毛刺和后方回聲衰減[15-16]。通過對(duì)比LA和LB型決策樹,綜合鈣化情況、腫瘤最大徑和淋巴結(jié)轉(zhuǎn)移情況可以區(qū)分兩者:① 腫瘤較小伴后方回聲衰減,腫瘤較大且無淋巴結(jié)轉(zhuǎn)移,提示LA,反映該亞型生長緩慢、膠原沉著引起后方回聲衰減、不容易發(fā)生淋巴結(jié)轉(zhuǎn)移的特征;② 出現(xiàn)鈣化、腫瘤較小、有淋巴結(jié)轉(zhuǎn)移提示為LB型,反映該亞型腫瘤易發(fā)生缺血引起鈣化以及相對(duì)容易發(fā)生淋巴結(jié)轉(zhuǎn)移的特征。

HER2+與一些不良的預(yù)后指標(biāo)有關(guān),如腫瘤較大、腫瘤分級(jí)高、腋窩淋巴結(jié)轉(zhuǎn)移和缺乏激素受體。決策樹模型中,病灶后方回聲無變化伴鈣化形成提示HER2+,反映該亞型腫瘤生長快,容易發(fā)生鈣化的特征,這與相關(guān)研究[4,13]結(jié)果類似。

TNBC具有侵襲性強(qiáng)、容易轉(zhuǎn)移和復(fù)發(fā)、臨床預(yù)后較差的特點(diǎn),在超聲圖像上形態(tài)較為規(guī)則容易被誤診為良性而延誤治療。因此,準(zhǔn)確檢出TNBC具有重要臨床價(jià)值。決策樹模型中,腫瘤后方回聲增強(qiáng)且無微鈣化,預(yù)測(cè)TNBC的準(zhǔn)確度為100.0%(12/12);腫瘤后方回聲無增強(qiáng)且最大徑>30.5 mm,同時(shí)有淋巴結(jié)轉(zhuǎn)移,預(yù)測(cè)TNBC的準(zhǔn)確度為88.9%(8/9)。模型預(yù)測(cè)可對(duì)應(yīng)病理學(xué)改變[15-16]:TNBC組織學(xué)分級(jí)高、生長迅速,癌細(xì)胞在病灶邊緣呈擠壓式生長,形態(tài)較為規(guī)則;淋巴細(xì)胞浸潤明顯,腫瘤以癌細(xì)胞為主且較少發(fā)生纖維組織反應(yīng),后方回聲增強(qiáng)[17]。

由于不同分子亞型浸潤性乳腺癌的超聲征象和臨床表現(xiàn)較為復(fù)雜,常規(guī)統(tǒng)計(jì)學(xué)方法不能很好地區(qū)分[4-5,18]。機(jī)器學(xué)習(xí)自動(dòng)綜合分析多維度信息并建立相應(yīng)模型,已應(yīng)用于乳腺癌診治(如腋窩淋巴結(jié)轉(zhuǎn)移預(yù)測(cè)、療效評(píng)價(jià)等)[19]。決策樹模型能提取特征之間更為復(fù)雜的關(guān)系,具有可解釋性好、離散型和連續(xù)型特征整合能力強(qiáng)等特點(diǎn),已應(yīng)用于多種疾病的鑒別診斷[20]。本研究建立了預(yù)測(cè)乳腺癌分子亞型的決策樹模型,模型在訓(xùn)練集和測(cè)試集中準(zhǔn)確度較高,尤其是在預(yù)測(cè)TNBC時(shí)表現(xiàn)優(yōu)異(訓(xùn)練集AUC=0.877)。針對(duì)一個(gè)未知亞型的腫塊,我們從臨床和超聲特征中提取了其特征,將其輸入4個(gè)決策樹模型中預(yù)測(cè)亞型(例1:最大徑32 mm,低回聲,分葉狀,血流信號(hào)豐富,后方回聲增強(qiáng),無鈣化,只有TNBC型模型符合,故預(yù)測(cè)為TNBC型。例2:最大徑25 mm,低回聲,邊緣不規(guī)整,后方回聲衰減,微小鈣化,有淋巴結(jié)轉(zhuǎn)移,只有HER2+型模型符合,故預(yù)測(cè)為HER2+型)。此外,已有研究[21]表明,機(jī)器學(xué)習(xí)技術(shù)在臨床上表現(xiàn)出比醫(yī)師診斷更高的靈敏度。本研究發(fā)現(xiàn)決策樹模型對(duì)3種分子亞型的鑒別靈敏度均高于超聲科醫(yī)師,這與已有研究結(jié)果一致。

本研究的不足之處:① 本研究結(jié)果來自單中心研究,尚需更廣大樣本臨床研究來驗(yàn)證;② 模型納入指標(biāo)為常規(guī)超聲特征,未納入彈性成像、超聲造影等特征;③ 該模型在不同機(jī)器之間的診斷效能還需隨機(jī)對(duì)照試驗(yàn)驗(yàn)證;④ LB根據(jù)HER2檢測(cè)結(jié)果分為LB(HER2-)亞型和LB(HER2+)亞型,因LB(HER2+)病例數(shù)較少,本研究將兩者合并分析;⑤ 4個(gè)決策樹模型之間相互獨(dú)立,未來可在模型融合方面進(jìn)行探索。

綜上所述,乳腺癌分子分型是超聲征象的基礎(chǔ),兩者有顯著相關(guān)性。我們提出了基于超聲和臨床特征構(gòu)建的決策樹模型來預(yù)測(cè)乳腺癌分子亞型,并獲得了較高的準(zhǔn)確度,可為乳腺癌個(gè)體化治療提供更多有價(jià)值的信息。

猜你喜歡
亞型決策樹B型
2020年全球高致病性禽流感疫情概況及分析
2012—2018年長春市手足口病非腸道病毒A組71型腸道病毒V P1基因特征分析
簡(jiǎn)述一種基于C4.5的隨機(jī)決策樹集成分類算法設(shè)計(jì)
驗(yàn) 血
849例婦產(chǎn)科患者HPV基因分型檢驗(yàn)及結(jié)果分析
決策樹學(xué)習(xí)的剪枝方法
臨床表現(xiàn)為心悸的預(yù)激綜合征B型心電圖1例
決策樹在施工項(xiàng)目管理中的應(yīng)用
《潛伏》等48則