南京醫(yī)科大學(xué)第一附屬醫(yī)院超聲診斷科,江蘇 南京 210000
超聲影像組學(xué)特征有成為診斷、分型、預(yù)測(cè)預(yù)后或評(píng)估治療反應(yīng)的影像學(xué)標(biāo)志物的潛力[1-3]。因此,本研究旨在開發(fā)并驗(yàn)證一種基于二維超聲圖像的影像組學(xué)模型,幫助臨床醫(yī)師術(shù)前預(yù)測(cè)浸潤(rùn)性乳腺癌(invasive breast cancer,IBC)患者的淋巴管血管侵犯(lymphovascular invasion,LVI)狀態(tài),以制訂個(gè)體化治療策略。
選取2018年1月—2019年4月于南京醫(yī)科大學(xué)第一附屬醫(yī)院術(shù)前進(jìn)行超聲檢查的258例IBC患者,患者超聲圖像均來(lái)自于同一臺(tái)超聲儀器。納入標(biāo)準(zhǔn):① 經(jīng)術(shù)后病理組織學(xué)確診的IBC患者;② 無(wú)新輔助治療史;③ 術(shù)前2周內(nèi)行超聲檢查;④ 臨床病理學(xué)資料及超聲圖像完整。排除標(biāo)準(zhǔn):① 有其他腫瘤病史;② 多發(fā)性或非腫塊性病灶;③ 病灶在超聲檢查前已進(jìn)行活檢;④ 超聲圖像未能成功提取特征?;颊呔鶠榕?,年齡23~91歲,平均年齡54.56歲;腫塊最大徑為0.8~5.0 cm,平均直徑2.17 cm。
1.2.1 儀器
采用意大利Esaote公司的Mylab Twice彩色超聲診斷儀,使用高頻(4~13 MHz)線陣探頭(LA523)。
1.2.2 檢查方法
患者采用仰臥位或側(cè)臥位,雙手上舉,充分暴露雙側(cè)乳房及腋窩,由經(jīng)驗(yàn)豐富的超聲科醫(yī)師對(duì)完全暴露的乳頭乳暈及乳房各個(gè)象限進(jìn)行全面掃描并保留腫塊最大截面。觀察腫塊的位置、形態(tài)邊緣、內(nèi)部回聲、是否有鈣化及后方回聲等,根據(jù)美國(guó)放射學(xué)會(huì)(American College of Radiology,ACR)乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BIRADS)分類標(biāo)準(zhǔn)[4]對(duì)腫塊進(jìn)行分類。同時(shí)檢查腋下Ⅰ、Ⅱ和Ⅲ區(qū)淋巴結(jié),如果超聲檢查時(shí)發(fā)現(xiàn)至少有以下可疑表現(xiàn)之一,則認(rèn)為腋窩淋巴結(jié)(axillary lymph node,ALN)陽(yáng)性。① 淋巴結(jié)皮質(zhì)厚度大于3 mm;② 長(zhǎng)短徑比大于2;③ 淋巴門完全或部分消失;④ 彩色多普勒超聲圖像顯示非淋巴門型血流;⑤ 淋巴結(jié)內(nèi)微鈣化。
臨床病理學(xué)因素從南京醫(yī)科大學(xué)第一附屬醫(yī)院病歷系統(tǒng)中獲取,包括年齡、雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人表皮生長(zhǎng)因子受體2(human epidermal growth factor receptor 2,HER2)、Ki-67標(biāo)記指數(shù)及病理組織學(xué)類型(如浸潤(rùn)性導(dǎo)管癌、小葉癌及其他等)。ER、PR陽(yáng)性定義為ER、PR染色陽(yáng)性≥10%。經(jīng)免疫組織化學(xué)法檢測(cè)HER2時(shí),若病灶為HER2+++時(shí),則直接定義為HER2陽(yáng)性;若病灶為HER2+或無(wú)表達(dá)時(shí),則直接定義為HER2陰性;若表現(xiàn)為HER2++時(shí),需進(jìn)行熒光原位雜交(fluorescence in situ hybridization,F(xiàn)ISH)檢測(cè)判斷HER2基因擴(kuò)增狀態(tài)。根據(jù)2011年St.Gallen乳腺癌共識(shí)[5]將Ki-67>14%定義為Ki-67標(biāo)記指數(shù)高。所有病灶術(shù)前均行穿刺活檢,ER、PR、HER2、Ki-67標(biāo)記指數(shù)及病理組織學(xué)類型等臨床因素通過(guò)病灶粗針穿刺活檢獲得。
1.4.1 腫瘤分割
腫瘤分割是由1名超聲科醫(yī)師使用ITK-SNAP軟件進(jìn)行手動(dòng)分割。在每例患者病灶超聲圖像的最大橫斷面上繪制感興趣區(qū)域(region of interest,ROI),沿著病灶的可見(jiàn)邊界,以囊括整個(gè)病灶(圖1)。在邊緣模糊或有毛刺的情況下,則盡可能完全地包括病灶,繪制病灶的最大范圍。分割結(jié)果最終由1名有15年工作經(jīng)驗(yàn)的超聲科醫(yī)師進(jìn)行驗(yàn)證。
圖1 ROI勾畫示意圖
1.4.2 特征提取與選擇
從二維超聲圖像中可提取出反映腫瘤異質(zhì)性的影像組學(xué)特征,提取的影像組學(xué)特征可分為兩類:一階特征和紋理特征。一階特征包括形狀、大小特征和強(qiáng)度特征等。紋理特征的提取是基于4種紋理矩陣,包括灰度共生矩陣(grey level cooccurrence matrix,GLCM)、灰度運(yùn)行長(zhǎng)度矩陣(grey level run-length matrix,GLRLM)、灰度大小區(qū)域矩陣(grey level size zone matrix,GLSZM)和灰度依賴矩陣(gray level dependence matrix,GLDM)。所有的特征提取均采用開源Pyradiomics軟件包實(shí)現(xiàn)。為測(cè)試影像組學(xué)特征的穩(wěn)定性,2名超聲科醫(yī)師隨機(jī)選取70例患者勾畫ROI,其中1名超聲科醫(yī)師在1周內(nèi)獨(dú)立重復(fù)上述操作。通過(guò)計(jì)算組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)和組間相關(guān)系數(shù)(interclass correlation coefficient,CCC)來(lái)確定特征的穩(wěn)定性,ICC和CCC低于0.75的特征被排除在最終的特征數(shù)據(jù)集中。2種機(jī)器學(xué)習(xí)算法,包括最大相關(guān)性最小冗余度(maximum relevance minimum redundancy,mRMR)和最小絕對(duì)收縮和選擇算子(the least absolute shrinkage and selection operator ,LASSO)回歸算法,被用于篩選與預(yù)測(cè)LVI狀態(tài)相關(guān)的影像組學(xué)特征。mRMR可最大限度區(qū)分LVI陰性和陽(yáng)性的特征,并消除冗余和不相關(guān)的特征,本研究通過(guò)篩選,保留了30個(gè)特征。隨后使用LASSO回歸算法與懲罰參數(shù)調(diào)整進(jìn)行10倍交叉驗(yàn)證,選擇交叉驗(yàn)證二項(xiàng)偏差最小的最優(yōu)特征數(shù)據(jù)集,將非零系數(shù)定義為所選特征的權(quán)重,表示特征與LVI的相關(guān)性。
1.4.3 模型建立
3種術(shù)前預(yù)測(cè)LVI狀態(tài)的模型最終建立:影像組學(xué)評(píng)分、臨床模型及影像組學(xué)模型。為了建立臨床模型,我們對(duì)臨床參數(shù)進(jìn)行單因素和多因素分析,最終將有統(tǒng)計(jì)學(xué)意義的參數(shù)納入臨床模型。并通過(guò)logistic回歸算法聯(lián)合影像組學(xué)評(píng)分和有效臨床參數(shù),建立影像組學(xué)模型,以預(yù)測(cè)IBC患者術(shù)前LVI狀態(tài)。
1.4.4 模型評(píng)估
3種模型的診斷性能通過(guò)受試者工作特征(receiver operating characteristic,ROC)曲線分析評(píng)估,并使用Delong驗(yàn)證來(lái)比較不同模型曲線下面積(areas under curve,AUC),確定它們的診斷效能之間是否有顯著差異。研究中預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)之間的差異通過(guò)校準(zhǔn)曲線和Hosmer-Lemeshow試驗(yàn)來(lái)評(píng)估。最終,通過(guò)對(duì)整個(gè)隊(duì)列中不同閾值概率下的凈效益進(jìn)行量化,進(jìn)行決策曲線分析(decision curve analysis,DCA)以確定影像組學(xué)模型的臨床有效性。
所有統(tǒng)計(jì)學(xué)分析均使用R 3.6.2軟件包進(jìn)行。分類變量用百分比表示,采用χ2檢驗(yàn)或Fisher精確檢驗(yàn);連續(xù)變量用±s表示,采用獨(dú)立樣本t檢驗(yàn)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。本研究中所需R安裝包:使用“mRMR”包進(jìn)行mRMR算法;LASSO Cox回歸使用“glmnet”包;“pROC”包用于繪制ROC曲線;“rms”包用于模型可視化和校準(zhǔn)曲線;DCA通過(guò)“devtools”和“rmda”包執(zhí)行。
訓(xùn)練組和驗(yàn)證組的臨床特征如表1所示,單因素分析顯示,年齡、LVI患者數(shù)目、超聲最大腫瘤直徑(maximum tumor diameter,MTD)、腫瘤病理組織學(xué)類型、ER、PR、HER2、Ki-67、超聲BI-RADS分類、超聲ALN狀態(tài)及ALN陽(yáng)性數(shù)目等臨床參數(shù)在訓(xùn)練組和驗(yàn)證組之間差異無(wú)統(tǒng)計(jì)學(xué)意義。表2顯示了訓(xùn)練組和驗(yàn)證組中超聲ALN狀態(tài)和實(shí)際ALN狀態(tài)對(duì)比,兩者間差異無(wú)統(tǒng)計(jì)學(xué)意義(P=0.33)。本研究中超聲檢測(cè)ALN準(zhǔn)確度、特異度、靈敏度、PPV及NPV分別為72.48%、94.61%、31.87%、76.32%及71.82%。
表1 訓(xùn)練組和驗(yàn)證組中臨床病理學(xué)特征比較 n(%)
表2 超聲腋窩淋巴結(jié)和腋窩淋巴結(jié)病理學(xué)狀態(tài)
根據(jù)病理組織學(xué)結(jié)果,可將患者分為兩組:LVI陽(yáng)性組和LVI陰性組。在訓(xùn)練集中對(duì)LVI陽(yáng)性及陰性組臨床特征進(jìn)行單因素分析,如表3所示,年齡、超聲MTD、超聲BI-RADS分類、超聲ALN狀態(tài)及ALN陽(yáng)性數(shù)目等臨床特征差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。隨之,將單因素分析中有意義的臨床因素納入logistic多變量分析(表4),得出超聲ALN狀態(tài)及超聲BI-RADS分類是預(yù)測(cè)IBC患者LVI狀態(tài)的獨(dú)立影像因子,并根據(jù)多因素分析結(jié)果繪出臨床預(yù)測(cè)模型(圖2)。
表3 訓(xùn)練組術(shù)前臨床病理學(xué)特征單因素分析結(jié)果 n(%)
表4 訓(xùn)練組術(shù)前臨床病理學(xué)特征多因素分析結(jié)果
圖2 臨床模型
圖3 LASSO回歸算法
圖4 經(jīng)mRMR及LASSO回歸算法選擇的特征
表5 公式系數(shù)及特征
通過(guò)logistic回歸算法聯(lián)合影像組學(xué)評(píng)分和有效的臨床病理學(xué)參數(shù),建立影像組學(xué)模型(圖5)。如圖6A、B所示,在訓(xùn)練組中,影像組學(xué)模型在3種模型中均具有最好的預(yù)測(cè)能力,影像組學(xué)模型AUC為0.865,而另兩種模型分別為0.729和0.801,在驗(yàn)證組中亦然(AUC:0.857 vs 0.786 vs 0.759),較之單純使用影像組學(xué)評(píng)分或臨床模型,聯(lián)合了超聲影像組學(xué)評(píng)分和有效臨床因素的影像組學(xué)模型預(yù)測(cè)能力顯著提高(表6)。校準(zhǔn)曲線驗(yàn)證了在訓(xùn)練集和驗(yàn)證集中預(yù)測(cè)的LVI狀態(tài)與實(shí)際LVI狀態(tài)有良好的一致性(圖7A、B),且通過(guò)Hosmer-Lemeshow檢驗(yàn),顯示預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)之間差異無(wú)統(tǒng)計(jì)學(xué)意義(P=0.371、0.094),說(shuō)明組合模型具有良好的校準(zhǔn)能力。圖8總結(jié)了DCA預(yù)測(cè)模型的臨床應(yīng)用情況,結(jié)果證明,影像組學(xué)模型在很大的風(fēng)險(xiǎn)閾值概率范圍內(nèi)可提高對(duì)LVI陽(yáng)性風(fēng)險(xiǎn)的預(yù)測(cè)能力。因此,我們構(gòu)建了一個(gè)列線圖以可視化方式表示預(yù)測(cè)結(jié)果。
圖5 影像組學(xué)模型
圖6 訓(xùn)練組(A)及驗(yàn)證組(B)中各個(gè)模型的ROC曲線
圖7 訓(xùn)練組(A)及驗(yàn)證組(B)中影像組學(xué)模型的校準(zhǔn)曲線
圖8 影像組學(xué)模型的DCA
表6 3種預(yù)測(cè)模型的AUC比較
乳腺癌是女性最常見(jiàn)的惡性腫瘤,其預(yù)后情況也是人們關(guān)注的重中之重[6]?;颊叩哪挲g、腫瘤大小、ALN狀態(tài)、腫瘤的組織學(xué)分級(jí)、ER、PR和HER2等因素是評(píng)估乳腺癌患者預(yù)后和制訂適當(dāng)?shù)闹委煵呗缘闹匾笜?biāo)[7-9]。而近年來(lái),LVI也被報(bào)道為乳腺癌患者的一個(gè)較強(qiáng)的預(yù)后因素[10-11]。LVI是指腫瘤細(xì)胞侵犯淋巴管血管壁或彌漫于管腔內(nèi)形成癌栓,是腫瘤細(xì)胞播散轉(zhuǎn)移導(dǎo)致疾病復(fù)發(fā)或進(jìn)展的關(guān)鍵步驟超聲檢查可以發(fā)現(xiàn)較大脈管內(nèi)形成的癌栓。先前的研究[12-14]發(fā)現(xiàn),LVI與較低的平均年齡、Ki-67標(biāo)記指數(shù)、腫瘤大小、陽(yáng)性淋巴結(jié)和組織學(xué)分級(jí)等有關(guān)。本研究表明,ALN狀態(tài)與LVI陽(yáng)性風(fēng)險(xiǎn)相關(guān)。LVI患者的ALN陽(yáng)性概率大于無(wú)LVI患者,這與Zhang等[15]的觀點(diǎn)相似,這種相關(guān)性可以部分解釋ALN陽(yáng)性乳腺癌患者的不良預(yù)后。超聲BI-RADS分類亦是IBC患者LVI狀態(tài)的一個(gè)重要的獨(dú)立預(yù)測(cè)因子。BI-RADS分類越高LVI陽(yáng)性率越大,這或許是病灶的超聲BI-RADS分類越高,惡性征象(如邊緣毛刺或乳房懸韌帶受牽拉等)更多、更顯著,腫瘤侵襲性更強(qiáng),發(fā)生LVI的可能性更大,導(dǎo)致預(yù)后更差[16-17]。
影像組學(xué)是一種計(jì)算機(jī)輔助技術(shù),通過(guò)計(jì)算機(jī)算法將醫(yī)學(xué)影像信息轉(zhuǎn)換成一系列數(shù)據(jù)[18]。既往研究[19-20]發(fā)現(xiàn),影像組學(xué)特征與腫瘤的微觀結(jié)構(gòu)和生物學(xué)行為密切相關(guān)。影像組學(xué)特征反映了腫瘤的紋理信息,是判斷腫瘤內(nèi)和腫瘤間異質(zhì)性的重要指標(biāo)。腫瘤內(nèi)異質(zhì)性可能是基因組異質(zhì)性的結(jié)果,這與腫瘤進(jìn)展和轉(zhuǎn)移行為有關(guān),基因組異質(zhì)性越大,腫瘤越容易轉(zhuǎn)移和產(chǎn)生耐藥性,預(yù)后就越差[21]。研究[22]表明,基因組異質(zhì)性可以從醫(yī)學(xué)圖像中識(shí)別出來(lái),然而,生物過(guò)程和影像組學(xué)特征之間的聯(lián)系仍然是復(fù)雜的。紋理特征可以量化單個(gè)腫瘤在結(jié)構(gòu)和功能上的空間變化,而其中應(yīng)用最廣泛的紋理特征便是GLCM,GLCM通過(guò)描述圖像灰度的空間相關(guān)特性來(lái)反映紋理信息,既往多項(xiàng)研究[23-26]支持GLCM與腫瘤內(nèi)部異質(zhì)性相關(guān),這與本研究結(jié)果相一致。一階特征中的峰度也是本研究中影像組學(xué)評(píng)分的重要組成部分,是基于圖像直方圖平均值的不對(duì)稱分布尺度。峰度在影像組學(xué)研究中的應(yīng)用也較為廣泛,在Niu等[27]的研究中證實(shí)了此項(xiàng)特征與腫瘤的異質(zhì)性相關(guān)。
超聲醫(yī)師主觀判斷的超聲圖像特征,結(jié)合臨床病理學(xué)或基因因素,在術(shù)前預(yù)測(cè)IBC患者的LVI狀態(tài)[17]。本研究結(jié)果表明,根據(jù)影像組學(xué)特征權(quán)重開發(fā)的影像組學(xué)評(píng)分對(duì)LVI預(yù)測(cè)能力較佳。此外,將超聲影像組學(xué)評(píng)分納入臨床模型后,臨床模型的AUC從0.729顯著提高到0.865,預(yù)測(cè)LVI的能力優(yōu)于單獨(dú)的影像組學(xué)評(píng)分和臨床模型,且在預(yù)測(cè)IBC患者LVI方面是穩(wěn)定的。DCA顯示,比起臨床模型和影像組學(xué)評(píng)分,超聲影像組學(xué)模型將使更多的患者受益,這表明影像組學(xué)評(píng)分增加了臨床危險(xiǎn)因素在臨床有用性方面的增量?jī)r(jià)值。因此,我們開發(fā)基于超聲影像組學(xué)特征的模型用于術(shù)前個(gè)體化預(yù)測(cè)IBC患者的LVI狀態(tài),且為了臨床醫(yī)師使用更為便捷可視化,我們進(jìn)一步開發(fā)了包含超聲影像學(xué)評(píng)分和臨床病理學(xué)特征等多種危險(xiǎn)因素的列線圖,以幫助臨床醫(yī)師術(shù)前對(duì)患者LVI狀態(tài)進(jìn)行個(gè)體化預(yù)測(cè)。
本研究有以下局限性:首先,由于樣本規(guī)模相對(duì)較小,統(tǒng)計(jì)能力可能會(huì)有所欠缺。其次,本研究完全是回顧性分析,需要通過(guò)前瞻性研究進(jìn)行驗(yàn)證,且缺乏多中心驗(yàn)證。第三,F(xiàn)ujii等[28]發(fā)現(xiàn),LVI中血管侵犯(blood vessel invasion,VI),而非淋巴管侵犯(lymphatic invasion,LI)可能是生物侵襲性的指標(biāo),是一個(gè)有效的預(yù)后因素。然而,本研究沒(méi)有單獨(dú)分析LI和VI對(duì)乳腺癌患者預(yù)后的影響,這也是我們未來(lái)研究的方向之一。
總之,影像組學(xué)特征可以作為術(shù)前預(yù)測(cè)IBC患者LVI情況的影像學(xué)標(biāo)記,基于超聲影像組學(xué)評(píng)分和臨床病理學(xué)特征的影像組學(xué)模型有助于指導(dǎo)制訂個(gè)性化治療策略。